Hadoop监控之Nagios 与 Ganglia 整合

来源:互联网 发布:java怎么样 编辑:程序博客网 时间:2024/04/28 19:01

Nagios架构

这里写图片描述
Web : 用户通过web界面来管理Nagios
Database:被监控的数据放入数据库
右边的框代表被管理的机器,针对Llinux上的监控进程时NRPE。
负责获取监控数据或者执行命令,NRPE和Nagios Server 通过SSL协议来进行监控和命令执行的信任授权。
这里写图片描述
– Nagios是一个监测的管理中心,但是他自身并不包括具体的检查的代码。也就是说:所有的监测、监测功能都是由相关插件来完成的。Nagios自身也没有报警部分的代码和插件,而是交给用户或者其他相关开源项目组去完成。他只是去监控相应的插件,触发监控动作和处理返回值,从而到达监控的效果。
– 它是一个框架,插件粘合剂。

Nagios安装

主监控机
– yum install nagios nagios-plugins nagios-plugins-all nagiosplugins-nrpe nrpe
– service nagios start; service httpd start
– 访问http:///nagios/,默认用户名密码都是:
nagiosadmin
被监控机
– yum install nagios-plugins nagios-plugins-nrpe nrpe nagiosplugins-load nagios-plugins-disk nagios-plugins-swap
– /etc/nagios/nrpe.cfg添加允许访问的机器地址或域名:
• allowed_hosts=127.0.0.1,Hagrid01
– 启动nrpe守护进程
• nrpe -c /etc/nagios/nrpe.cfg -d
同过 ps ax | grep nrpe 查看一下是否启动正常
• 从监控机执行命令检查被监控机nrpe是否正常
: /usr/lib64/nagios/plugins/check_nrpe -H <被监控机IP>
配置检测
通过这个命令可以检查配置是否有误。
– nagios -v /etc/nagios/nagios.cfg

经过以上简单的配置(启动 nagios 和 httpd 服务,以及启动nrpe监控服务后),就可以查看当前web监控页面了:
这里写图片描述

Nagios配置及使用说明

• 主配置文件:/etc/nagios/nagios.cfg
• Resouce定义文件:包含宏定义
• Object定义文件
• CGI定义文件
这里写图片描述

理解Nagios主配置文件:

log_file=/var/log/nagios/nagios.log  # log地址# 所有的object配置文件,例如:cfg_file=/etc/nagios/objects/commands.cfg                                                              cfg_file=/etc/nagios/objects/contacts.cfg                                                                 cfg_file=/etc/nagios/objects/timeperiods.cfg                                                                      cfg_file=/etc/nagios/objects/templates.cfg  # resource配置文件resource_file=/etc/nagios/private/resource.cfg 

Object定义文件

Object有以下几种类型:
Services、 Service Groups、 Hosts、 Host Groups、 Contacts、 Contact
Groups、 Commands、Time Periods、Notification Escalations、Notification
and Execution Dependencies

注意:附上的参考连接中红色的部分是必填部分

Service : 对监控节点上的service的监控
https://assets.nagios.com/downloads/nagioscore/docs/nagioscore/4/en/objectdefinitions.html#service

Host:对监控节点本身的监控
https://assets.nagios.com/downloads/nagioscore/docs/nagioscore/4/en/objectdefinitions.html#host

Contact:定义监控报告发给哪些人
• https://assets.nagios.com/downloads/nagioscore/docs/nagioscore/4/en/objectdefinitions.html#contact

Command:执行一个命令
• https://assets.nagios.com/downloads/nagioscore/docs/nagioscore/4/en/objectdefinitions.html#command

这里写图片描述

自定义监控脚本的通过执行返回值来告知nagios检测对象的状态:0-正常 1-警告 2-严重错误 3-未知错误

command存放于 /usr/share/ganglia/nagios 下
https://github.com/ganglia/monitor-core/wiki/Ganglia-Nagios-Integration

hbase监控相关指标http://blog.csdn.net/wuwenxiang91322/article/details/46425403

0 0