云监控介绍

来源:互联网 发布:淘宝上的被子好吗 编辑:程序博客网 时间:2024/06/01 08:00

云监控介绍 - 青云 QingCloud


作者:张航东
本文主要用于个人学习、总结,欢迎转载,但请务必注明作者和出处,感谢!


青云是一个提供按需分配、弹性可伸缩的计算能力的公有云服务。本文主要针对青云监控告警相关的功能进行介绍,并且阐述作者本人对青云的一些简单看法和评价,仁者见仁,智者见智,不喜忽喷。

关键青云和其监控告警的介绍,大家也可以查阅官方文档:
青云用户指南:https://docs.qingcloud.com/guide/
其中监控告警部分:https://docs.qingcloud.com/guide/management/alarm.html


整体介绍

青云的监控告警功能,相对比较典型,总的来说,就只有2部分:监控和监控告警(即告警)。
个人感觉值的称赞的是,青云将监控和告警完美的进行了解耦,在界面控制台分别呈现了相对独立的功能,在用户体验方面,可以让普通用户非常流畅的操作和使用。

接下来,我们对监控和告警分别进行介绍。


监控

入口:
在界面的控制台,并没有统一的监控界面或是自定义监控界面,监控界面的入口均是放在具体对应资源的详情页面。

功能:
参考如下对主机(虚拟机)的监控,就是在点击进入虚拟机详情页面后,在“监控”的页签下,我们便可以看到虚拟机所有的监控项,间隔5分钟。
每个监控项后均有一个“开/关”用于观察“实时数据”,默认始终是关闭状态,开启后监控的间隔将临时变为10秒。
这里写图片描述

“监控”页面和开/关“实时数据”可能因各资源而位置、方式不同,但基本上都在资源的详情页面,并且可以很轻松的找到。

收费策略:
资源的所有监控项默认都是有效的,并且开启“实时数据”也无需额外费用。也就是说,所有的监控其实都是免费。然而,资源本身基本都是收费的。

监控资源类型和指标:
https://docs.qingcloud.com/guide/management/alarm.html


告警

告警主要可以分为2部分功能:

  • 告警策略管理
  • 告警状态查看

告警策略管理

入口:
位于左侧主“控制面板”的“管理”下,如下图:
这里写图片描述

功能:
主要负责告警策略的管理,即告警策略的CRUD(增、删、改、查)。

一个告警策略主要有以下3部分组成,在创建时,通过向导方式依次填写。

  • 基本参数 - 告警名称、资源类型、监控周期
  • 告警规则 - 监控指标、阈值
  • 告警行为 - 触发条件、通知方式

资源类型和监控指标:可参阅“监控”章节的“监控资源类型和指标”
监控周期: 1分钟、5分钟。
触发条件:告警时、正常时、资源被删除时。(多选)
通知方式:手机、邮箱、微信、Webhook。(多选)

添加监控资源:
告警策略在创建时,只选择了监控的资源类型(如:虚拟机、LB、公网IP等)和指标项(如:CPU利用率、内存利用率、带宽等),但是并没有指定具体是监控哪一个资源(哪个虚拟机,哪个LB等)。也就是说这时创建的告警策略还只是一个通用的规则,或者说是模板。
这时,就需要一个额外的“操作”使这个规则/模板和具体的某一个/一些资源关联起来。这个“操作”就是“添加监控资源”。
告警策略创建成功后,会自动弹出提示框,要求“添加监控资源”,如下图:
这里写图片描述

这里也可以选择“取消”,后续再添加,列表和详情页都对应操作的按钮。

在添加时,会只列出属于该告警策略资源类型的资源。如,创建告警策略时选择的资源类型是“主机”(虚拟机),那么“添加监控资源”时,就只会列出虚拟机。
这里写图片描述

收费策略:
与亚马逊的 CloudWatch 类似,青云收费与否取决于监控周期,1分钟收费,5分钟免费。 但在实际使用中,作者发现虽然选择5分钟,但是底层依然是按1分钟来进行处理的。(占到便宜了^_^)

告警状态查看

入口:
上面我们介绍的“告警策略管理”,只是负责告警策略的CURD,并不能看到告警的状态,也就是是否产生告警,是否恢复正常。
“告警状态查看”的入口和“监控”的入口相同,均是放在具体资源的详情页面。如下图:
这里写图片描述

功能:
可以查看到告警策略,包含每一个监控指标和其状态(正常、告警、监控数据不足)。
同时也可以看到一条条的历史记录,什么时间发生了告警、什么时间发送了通知、什么时间恢复正常,什么时间修改了告警策略,单击某一条记录,会看到具体的数据和内容。如下图:
这里写图片描述


总结

总体来看,青云的监控告警做的还是很不错的。简单总结了一下:

优点:

  • 监控、告警功能和呈现方式相对独立
  • 告警策略和具体资源通过“绑定操作”进行解耦
  • 界面功能和操作清晰,易用性和友好度很高。
  • “实时数据”设计巧妙
  • 告警通知支持微信

缺点:

  • 功能比较典型,差异化特性比较少。
  • 存在少量Bug,例如监控周期底层始终是1分钟。
  • 没有统一的、可自定义配置的监控界面