使用监控宝监控网站和服务器的经验总结

来源:互联网 发布:java直角三角形 编辑:程序博客网 时间:2024/05/16 09:36

0、前言

      做为公司的服务器运维攻城狮兼程序猿,服务器的不稳定一直是运维人员的心头病,尤其是做为一名开发兼运维-_-!,还好可以利用一些监控工具,不但可以及时发现问题,而且还可以查找到一些问题的根源,相当管用......

1、概述

      “监控宝是由北京云智慧科技所提供的一项非免费服务,可以定时监控网站、服务和服务器器的可用率(Uptime)和响应时间(Response Time),一旦网站无法连结、Apache等Web服务器负载过高、Mysql等数据库压力过大、或是服务器发生错误,监控宝服务就会在最短的时间内以Email或简讯来通知网站管理员,让因网站停摆而造成的损失降到最低。监控宝同时支持基于线路和地区的监控告警设置,可以用来较好的应对中国复杂的网络状况和环境,帮助网站管理员更全面的了解和管理网站。

     

2、监控宝使用

      使用监控宝也大半年了,期间好几次服务器出现了小故障,也因为监控宝的实时告警,使得能够快速的发现问题。我们公司主要使用了监控宝的网站监控和服务器性能监控两项服务,尤其是网站监控,如果网站挂了直接会影响用户,因此它的宕机报警最有价值。接下来详细介绍下网站监控和服务器监控:

(1) 安装

     监控宝是通过标准的网络管理协议SNMP(简单网络管理协议)来对进行服务器监控的,因此需要在被监控的服务器上安装net-snmp,在linux平台上安装net-snmp方法非常简单,详细步骤可以参考监控宝提供的安装使用指南

(2)监控宝管理中心配置

         网站监控

         网站监控的配置非常简单,注册监控宝后,进入监控宝的管理中心,在创建监控项目中选择网站监控,根据网站的类型创建项目,在此,我选择监控网址(http/https)。其它的你可以根据实际需要选择监控如FTP服务器之类的项目。


         然后进入详细的配置,包括监控项目名称,URL,服务器IP(注意:若一个域名对应多个IP,建议填写指定IP,这样就可以实现对具体服务器网站进行监控了,这个功能很赞!),这步太简单了,不上图了。
       
         最后,根据实际需要设置监控频率、告警等。建议对用户影响大的服务器监控频率高些,这样可以实时地发现问题,同时设置Email,手机短信提醒,这样就基本可以保证你手机24小时都能了解到网站是否在正常运行了(除非你手机关机了鄙视)。
         

        服务器性能监控

        服务器性能监控的配置也很简单,主要配置的内容有需要监控的IP,Security Name, Pass Phrase等,要求服务器必须安装net-snmp,否则无法监控了。
       

(3)监控效果

        因为,我们服务器同时也配置了ganglia监控,虽然没有细心的对比两个结果的具体数据差异,但结果总体是一致的,效果还是很准确,因此还是很好用。具体的的分析在第4节详细分析下。


       当然,还有更详细的信息了,大家可以使用后看看。。。



3、服务器监控原理


       细心的朋友可能已经发现了为什么监控宝能通过网络监控到我们服务器的详细信息,原因是我们在服务器上安装了net-snmp。

       SNMP是“Simple Network Management Protocol”的缩写,即“简单网络管理协议”。SNMP是目前最常用的网络环境管理协议,它与协议无关,所以它可以在IP,IPX,AppleTalk,OSI以及其他用到的传输协议上被使用。SNMP是一系列协议组和规范,它们提供了一种从网络上的设备中收集网络管理信息的方法,同时它们也为设备向网络管理工作站报告问题和错误提供了一种方法。目前,几乎所有的网络设备生产厂家都实现了对SNMP的支持,设备的管理者收集这些 信息并记录在管理信息库(MIB)中。这些信息报告了设备的特性、数据吞吐量、通信超载和错误等。MIB有公共的格式,所以来自多个厂商的SNMP管理工具可以收集MIB信息,在管理控制台上呈现给系统管理员。

    总之,SNMP提供了一种统一的、跨平台的设备管理办法。

有的朋友可能担心服务器开放了SNMP后不会不安全?其实完全不用担心哈,因为监控宝对SNMP通过V3的加密身份验证和防火墙的保护,所以完全不用担心~~

4、与ganglia对比

       因为目前我们系统只使用了这两种监控,因此就对监控宝和ganglia做个对比分析吧。其实两者之间没有可比性啦,我就自己的使用经验做个简单分析吧


一、监控宝能够实时反应出外网访问情况,ganglia能够更详细的展现服务器性能的监控信息

       了解ganglia的朋友都知道ganglia是一个可以部署在服务器的开源的实时监控系统,它可以用来测量数以千计的节点,包括cpu 、mem、硬盘利用率, I/O负载、网络流量情况等,同时可以将历史数据以曲线方式通过网页呈现。

       相较与ganglia,监控宝是通过SNMP来对服务器和网站等进行远程监控,可以使管理员随时随地了解到具体的监控信息,如网站监控,可以详细的了解到某一地区的网络是否可以正常访问(这种问题不是服因为自己的服务器故障,而是外部网络的故障)。

       下面两张图是监控宝每天反馈的邮件内容截图,可以每天早上了解到前一天网站运行状况。(貌似只支持华东,西北,东北三个地区的网络监控,是不是有点少了~~~)


      因此,监控宝可以实时反应出外网访问情况;ganglia能够更详细的展现服务器性能的监控信息,对服务器运维非常有用的。

二、监控宝监控项目丰富,ganglia侧重于对服务器的性能监控

       因为监控宝是一款商业产品,因此具体丰富的监控项目是必然的,网站监控和服务器监控只是其中的两项,还有很多服务性能监控等项目。(貌似国内还有不少其它的监控,但监控宝应该是做的最多的吧)

       ganglia只是一款开源的服务器性能监控系统,如果想对服务器性能监控的话,ganglia还是很合适的。

三、监控宝告警提醒方式多样,ganglia只能通过网页查看

       监控宝提供了短信提醒,邮件提醒,还有其它提醒方式,你可以随时随地的了解到服务器和网站的运行状况,还有移动版!!!十分方便!!!

       这方面ganglia就弱了,只能查看网页了,不过ganglia有很好的扩展性,你可以自己开发相关的功能哈~~~


总结

       监控宝确实功能很强大!对管理员很有用! 在我们系统中使用了监控宝来监控网站性能和服务器性能(因为这两个功能是免费的哈!!),同时也使用了ganglia来监控服务器性能。
0 1
原创粉丝点击