应用监控报警设置的发展

来源:互联网 发布:ipad进销存软件哪个好 编辑:程序博客网 时间:2024/04/29 14:14

每个应用系统有成百上千个硬件和软件部件组成,每个部件有很多运行指标。 各个指标对标识应用运行状态都有价值。 应用监控人员依赖监控系统,收集数据,预测和报警。 报警设置不好, 会使管理人员疲于奔命,或者不能及时发现和处理影响应用性能的问题。  因此报警设置是应用监控系统的重要功能,体现系统的能力和水平。

早期监控系统提供设置各个运行参数的静态门限报警值, 是当时数值的计算。 这种报警适合于平稳负载,或者意外事件。对动态负载和性能管理帮助不大。 后来出现依据历史统计的门限设定。按历史上相同时间(节日,开门一小时)的统计值。 这种门限可以反映较细的性能和资源使用状态。利用历史数据也方便设置大量部件和指标。 但不适合作为动态网络应用的报警。 例如去年春节的购票负载和今年负载不同, 系统结构也有所变化。 这样去年的报警值未必适合今年。 

目前在研究的方法是在历史数据统计基础上,根据当前的工作负载,系统结构与历史负载和结构的比较,动态调整门限。 可以发现真正需要报警的问题,减小误报。 提高监控的工作效率。  这种方法是在传统基于时间统计的基础上,将负载和系统结构作为新的自变量。 进行多变量相关分析。分析的另一个作用是发现对判断系统状态,问题敏感的指标。 减小数据收集和处理成本,提高工作效率。