poller采集服务器的nagios无法启动了

来源:互联网 发布:学生网络辱骂老师 编辑:程序博客网 时间:2024/06/05 05:37

Centreon+nagios分布式监控架构中,有很多子节点。但是最近发现,一旦重启子节点服务器,然后nagios无法重启了。一直僵死在哪儿。


研究了很久,通过对比,发现是由于ndomod无法加载引起的。


打开nagios.cfg

broker_module=/usr/lib/nagios/ndomod.o config_file=/etc/nagios/ndomod.cfg

找到此行,然后注释掉本行,然后运行重启nagios。nagios运行成功。


但是,主节点无法捕获,该进程号。


后面研究,发现,如果打开上面这行


只要修改ndomod.cfg

#output_type=tcpsocket
#output=172.26.128.81
output_type=unixsocket
output=/var/log/nagios/ndo.sock

把TCP连接修改为unixsocket也可以。让nagios正常启动。


只是和主节点依旧无法通讯。


因此,定位到原因了。

tcpsocket

机制出现了问题.


今天依旧排查,使用route检查路由

发现没有到172.26.128.*网段的路由

加入路由

route add -net 172.26.128.0 netmask 255.255.255.0 gw 10.27.126.254


重新启动,成功了。

然后,观察Centreon,发现进程号,被获取到了。




0 0
原创粉丝点击