【精品文章推荐及点评】六个人如何运维一万台服务器?

来源:互联网 发布:黑米抢购软件靠谱吗 编辑:程序博客网 时间:2024/05/17 07:24

前言

推荐阅读51CTO技术栈 中一篇文章提到 六个人如何运维一万台服务器?

点评

每个公司随着规模发展都要经历这样的过程,设计概念中提到不要过早优化,说的就是在早起发展简单过度,随着规模化慢慢提升,不要问为什么这么过度,只要你实际参与就会明白“过早优化”实质是“过度劳化”,再就是企业成本问题。

最近几年微服务量化确实给运维增加压力,从运维角度说,监控服务基本基于业务跟踪定位,如文中说的,一旦定位交由具体研发负责人跟踪解决。对研发而言,所以文章里少了一个由研发主导运维协助实施的对集合微程序“链式划”性能跟踪的监控器(多多少少有些是硬编码切入程序),有了这样的监控,运维甚至可以通过界面网状关联信息知道程序如何运行,走到哪里,这样交由研发时候,直接告诉你那台机器那个程序那片代码造成什么问题。

比如比较有名的DapperskywalkingOneAPM等。