SUM服务器监控软件全面介绍

来源:互联网 发布:博士后的出路 知乎 编辑:程序博客网 时间:2024/05/16 18:05
 

[企业IT业务概况]
       大多企业和单位投入大量资金组建IT网络、购买各种企业运行支持软件、为不同的群体提供各式各样的IT支持。这些系统、硬件、软件已经为企业带了巨大的利益。随着IT规模的扩大,企业的IT设备的运行情况的查询、查看、管理与恢复成了IT运维管理部门难以控制和管理的工作,很多时候需要终端部门发现了业务无法使用后再电话通知IT部门进行处理,这对IT部门的运维来说显得十分被动,甚至达到不可控的地步。SUM服务器与网络设备监控软件,将为IT运维部门提供主动预警、主动提示、长期分析,是专一的IT设备状态监控系统。有了SUM,可以为您做些什么呢?

http://www.zhetao.com/omscms.oms?id=159


       [软件基本信息]
      SUM
(服务器/网络设备集中监控与管理平台软件)是哲涛科技采用完全自主研发的Verip平台(以前名为OMS)作为底层构件的IT基础产品,从其简体名称(SUM)可以看出它的目标就是让用户的全部IT基础设备和应用可以在SUM中得到“SUM”的监控和管理。也许可以用一句话描述SUMIT基础设施监控与管理中,如果你没有SUM你就真的没有“SUM

哲涛从不认为SUM是一个网管产品,网管的概念十分有限。SUM的目标是把所有网络设备、服务器、服务器中运行的应用、数据库、甚至用户想监控的任何可获取数据(二次开发)进行统一的监控与管理。网管的概念已经远远无法满足真正的IT基础运行与管理的需求。所以SUM不是网管而是比网管更集中的性能监控状态与管理中心。
      [SUM为企业带来的核心价值]
   实时监控所有IT设备的运行状态和性能
   IT运维部门最核心的期能就是确保所有IT设备硬件、软件、数据库正常工作。通过SUM服务器监控软件,IT管理员人员可以实时了解所有设备的工作状态,同时还可以查询历史记录。为IT人员对设备的运行状态趋势分析带了方便。SUM的超全面的监控让IT人员可以仅在SUM中就可以实现几乎全部的软件、硬件的集中监控。
   
   主动预警,变被动为主动
   主动预警让IT运维人员不再被动接受故障处理,提供IT人员对故障处理的效率、减少故障给企业带来的损失。SUM中可以对全部监控项目设定阀值、业务不可用等核心报警功能。让IT人员提前获知业务故障,获得最佳、最快捷的故障处理时间。

   减轻IT运维人员工作负担
   IT运维部门需要不定期/定期对各种设备的工作状态、资源使用状态、向上级部门/经理提供设备状态分析报告、性能变化报告,这些工作将花费IT人员大量的时间,同时对于历史信息(报告分析)还不可能完成,必然借助于SUM这样的集中监控平台。SUM向企业提供多种报表、自定报表 、实时状态。IT管理人员、IT工程师可以随时从系统中了解各设备的工作状态、性能趋势。

   VISIO集成,状态一目了然
   SUM与VISIO图络图、机架图的无缝结合,企业使用现有的VISIO图与SUM集成后即可自动实在VISIO图中显示各种设备的状态。

   SUM是超级大集中监控中心
   SUM几乎可以监控所有设备(甚至特殊硬件)、数据库、应用服务器、操作系统、自制软件等,这为企业的集中式监控带了便捷,IT人员只需要SUM软件中就可以随时查看任意设备的实时监控状态。

      [软件特色功能]

1.1   系统性能监控

SUM中你可以轻松监控常见系统性能(CPU、内存、磁盘、进程等)。主要有:

       Windows (监控方式MPSSNMP);

       Linux及各种基于GPLLinux商业版(监控方式SSHTelnet、或SNMP);

       UnixAIX/Solaris/HP-UNIX,监控方式SSHTelnet、或SNMP);

1.2   网络设备监控

基于SNMP可监控任何可网管(支持SNMP)的设备的性能、流量、丢包、错误、连接状态等(注意此功能不受品牌限制,只要支持SNMP即可,如果设备有私有MIB库,也可以由用户提供MIB,哲涛定义指定的分组)。

交换机;

路由器;

防火墙;

光纤交换机。

1.3   应用服务器与Web服务器监控

SUM为你提供各种应用的监控。主要有:

Weblogic8/9/10);

Websphere6.0/6.1/7.0);

JBoss(3.0以上)

Resin(3.0以上)

Tomcat(5.x以上)

IIS

Apache

1.4   TCP/UDP端口监控

任意的TCP端口监控,主要有:

Web端口;

FTP端口;

POP3端口;

SMTP端口等。

 

特别地:DNS的端口(UDP)解析监控。

1.5   数据库监控

SUM对数据库的监控是最全面的,它含盖:

Oracle

DB2

SQL Server

Sybase

MySQL

PostgreSQL

达梦数据库(DaMeng);

人大金仓数据库(KingBase)。

1.6   磁盘阵列监控

目前支持:NetAppIBM DSHP阵列(采用SNMP方式)。磁盘阵列只要是支持SNMP,具有控制器IP的均可监控,注意双控制器的需要分别监控。

1.7   虚拟化环境监控(VMware ESX)

SUM目前支持基于ESX环境的虚拟机控制台监控(此功能在ESX一上市SUM中就已经开始提供),同时ESX中安装的各种操作系统的监控与普通物理设备的监控完全一样。唯一不同的是对ESX-Console的监控控制台中,用户可以把此ESX中的虚拟系统在SUM中监控的节点连接到ESXSUM中的监控控制台中,当用户进入ESX的监控控制台可以直接查看到ESX中安装的其它的虚拟系统的总体状态,点击可以直接进入到对应的虚拟的性能控制台(即ESX中安装的各种虚拟系统在SUM中是分别看作是一个独立的物理系统进行监控)中。

通过对ESX的控制台进行监控,可以了解到ESX本身的物理性能。

对虚拟化系统的监控图:

       其中对ESX的监控主要监控下表:


SUM
中有关VMware ESX的物理机中虚拟机状态监控表(SNMP)

也就是说用户如果不关心虚拟机(客户系统OS,比如监控图中的A/B/C)中的具体性能,只关心它们的启/停状态的大概性能,可以通过ESX基础设施直接监控。但如果要监控A/B/C中的具体性能,比如磁盘空间、进程监控等详细内容就需要把为些客户系统作为普通的系统加入到SUM中进行监控。当然SUM中允许用户在ESX监控的设备控制台中把这些客户机的IP手动连接在一个状态中,以方便快速进入ESX中的虚拟机的监控控制台。

1.8   相关/关联设备/系统状态查询

SUM2012中用户可以进行设备关联,这为用户环境中的物理架构方式的状态查看带来方便。比如用户使用VMware物理机(控制台)、在其中安装了A,B,C等多个虚拟系统,这种情况在SUM中可以分别监控VM的控制台、ABC,同时在VM的监控控制台中,还可以把ABC状态查询列表直接加入到VM的控制台中,比如:

       此功能显示不仅仅用于VM,还可以用于多设备共同完成一件事(比如集群),通过关联这些设备,就可以在一个设备的控制台中同时查看到相同设备的工作状态,点击后进入该系统/设备的监控控制台。

1.9   任何JAVA程序运行的虚拟机(JVM)监控

SUM的监控功能不仅体现在对常见系统、数据库、网络设备、应用的监控,它还体现在它的无限扩展能力上,基中任何JAVA程序的虚拟JVM性能的监控就是SUM的典型扩展功能。主要监控JVM内存、缓存、细分内存、线程等JAVA虚拟机自身环境核心运行状态。

1.10     Windows扩展监控

SUMWindows的监控已经细分到进程(IO、线程、GDICPU、内存等)、磁盘(IO、读写能力)、CPU(处理器、中断、使用率、用户模式、系统模式等)、Windows服务运行状态(指定服务名称)、Windows事件统计监控、Windows事件关键词统计监控、文件系统监控(目录、文件)、终端登录情况监控(有多少人登录)、.Net计算环境监控、缓存监控、打印队列监控。

1.11     文件系统与脚本监控

SUM向用户提供文件系统与自定义脚本集成监控,让用户轻松扩展监控的计数器。可见,SUM的监控十分全面,它几乎可以涵盖用户的全部应用、设备的性能监控。SUM还具备文本文件(一般为应用的日志文件)中关键词搜索统计监控功能,让你的系统一发生有错误日志就按你设定的阀值、时间向相关人员提供报警。

原创粉丝点击