设为首页 收藏本站
查看: 1591|回复: 0

[经验分享] 【分布式centreon监控】部署及故障处理‘ndomod: Could not open data sink!’

[复制链接]

尚未签到

发表于 2019-1-26 10:24:06 | 显示全部楼层 |阅读模式
故障现象:
做了分布式centreon后,添加完poller之后centreon中查看poller状态始终为非运行状态


2012-8-20今天又遇到了同样的问题,加上poller还是非运行状态,最后是核心上nagios到poller上nagios的信任没有做,下次一定记得排查这一步


故障原因:
添加poller时在ndomod.cfg文件添加错误,将output的IP添加为poller自身的IP,该output是数据要发往的地方,在分布式环境中应该设置为远程核心节点的IP


处理过程:
查找资料说是 nagios目录的权限问题(http://bbs.chinaunix.net/thread-1689485-1-1.html),也有其他比如说重启ndo2db服务问题(http://blog.csdn.net/jack161641/article/details/6876464)但是都没有解决我的故障


只能自己摸索,这就有一条一定要注意,多看日志+配置文件

在日志里找到题目中的‘ndomod: Could not open data sink!’这一条时,才意识到问题所在


我的环境是做的分布式的centreon,结果在web界面配置poller节点时配置有误,导致上述原因
查看poller服务器上的ndomod.cfg文件,发现其中output变量为本地IP,结合无法连接至ndo2db,判断该IP应该为远程核心节点的IP


(分布式centreon中只在核心节点上起ndo2db程序,开放5668端口,各地poller通过该程序和远程DB交互存取监控数据 而ndomod.cfg就是指定本机poller所要连接的远程核心节点的信息,包括远程核心的IP,通信端口5668等其他设置)


其实归结问题根源是对整体架构不熟悉,尤其几个关键配置文件里的参数含义


ndomod.cfg:在poller上,就是指定本机poller所要连接的远程核心节点的信息,包括远程核心的IP,通信端口5668等其他设置
ndo2db.cfg:这个只在核心节点上有,是和后台数据库打交道的传话人,里面需要配置mysql DB的相关信息
nagios.cfg:这是nagios程序的主要配置文件,poller基本就等价于nagios的作用,(poller==nagios+ndoutils)
ndoutils:是为了将nagios数据处理后能写入数据库的模块
这有个图帮助理解:




分布式centreon部署过程:
参考http://bluemood.blog.运维网.com/1142811/958523
核心节点需要安装centreon,数据库
卫星节点需要安装nagios+ndoutils
剩下步骤主要在核心上完成,简单讲分为:
#1 建立到poller的信任
ssh-copy-id -i ~/.ssh/id_rsa.pub nagios@x.x.x.x


#2 copy plugins拷贝配置和插件文件
scp /usr/lib64/nagios/plugins/* nagios@x.x.x.x:/usr/lib64/nagios/plugins/


## copy conf of nagios
scp /etc/nagios/* nagios@x.x.x.x :/etc/nagios/


##3 在web界面添加节点即可,add poller on centreon web ,include
###@1 centreon->Pollers->add (复制并配置poller的IP)
###@2 centreon->ndomod.cfg->add(此处output的IP一定为核心节点的IP)
###@3 nagios->nagios.cfg->add (无须大改,复制改名即可)
###@4 add host &services on new poller ,restart
     (一定要加上至少一个服务在新poller上,否则重启失败)



下面是我的节点,没运行那个的确是网络有问题,改天再调














运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-667691-1-1.html 上篇帖子: 【centreon分布式监控】性能优化篇 下篇帖子: 配置Centreon 第10步时报: Ctitical Not Writable 解决方法
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表