建议CSDN用5个9的标准要求服务质量

来源:互联网 发布:窑炉棚板 淘宝 编辑:程序博客网 时间:2024/04/28 18:40
最近CSDN的Blog板块不是一般的不稳定,重大故障是屡屡发生。

首先是一次失败的换版,增加了一些无谓的功能,如最新更新,在每个博客里增加一些顶端链接等等。刚上去不久,站点http://blog.csdn.net就不可访问了。CSDN于是回退倒上一个版本,很多数据出现显示丢失现象。

接着不久,又有一次更离谱的问题,访问http://blog.csdn.net居然要求输入Windows的用户认证密码!大概这个时候,CSDN的员工正在现场抢修。

随着这个周末,CSDN的站点又剧慢无比了!点击任何一个Blog都需要10分钟以上才能打开。

这对于提供服务为主要业务的CSDN可以说是企业生存性命攸关的大事故!在我看来,CSDN应该也是列数SaaS(软件作为服务)的企业,SaaS最重要的是什么?是高可用性(High Available),就是让用户始终可以访问到站点和功能。高可用性对SaaS企业就像水对鱼那样的重要!Salesforce公司,一家被认为是SaaS企业中的翘楚,由于2006年初几次事故,尽管客户成长,收入和现金流都非常好,股票却在数月间跌了25%。为什么,因为投资者对企业的Hosting能力产生了怀疑。

对CSDN来说,提高Hosting能力应该是当务之急。作为一个CSDN的多年用户,我在这里提几个建议:

1、少就是多。
产品特性不是越多越好,而是有核心竞争力的特性要稳固易用。少一点特性,多一些易用,是SaaS企业应该奉为圭皋的信条。CSDN的核心客户应该是博友们,留住这些博友就是所谓的产品的粘性(Stick),而产品粘性最重要的就是易用稳定。

2、Blog板块的运作应该围绕Hosting,设定质量指标,如5个9的目标。这里介绍一家国外顶级SaaS公司的运作。
整个企业的由三大板块组成:Marketing,R&D和Hosting。Marketing负责研究市场,提出新特性,销售;R&D是做产品;Hosting则负责把R&D研发出来的产品发布到Production环境中去以及各种各样的监控和维护。这里特别要说明的是,Hosting部门由CIO领衔,人员配备齐全,占公司总人数近1/3,资金充足,是最重要的核心部门之一。就像是电信公司的运行部门一样。

而R&D部分呢,研发的产品是不能随便上到Production环境上去的。其产品要上Production的基本流程是这样:

产品ER - 指Engineering团队把产品特性完成,通过QA的验证,作为一个可用版本保存。
 ||
 //
服务发布验证 - QA验证完还不够,专门一个小组将发布的可用版本做一次模拟安装,这种模拟安装要求Engineering提高的安装说明必须是傻瓜型的,任何错误都会被打回去。
 ||
 //
Beta - 请少数关系良好的客户,当然包括内部用户试用。
 ||
 //
LA - Limit Available,表示让少数少数关系良好的客户正式使用。
 ||
 //
GA - Global Available,全部使用,这时所有客户才会看到全新产品。

经过的这么都手续,目的就是一个,保证产品升级换代的稳定性。SaaS的软件比传统的软件开发难度大多了,传统卖拷贝的软件,安装新版本,如果出问题,是一个一个个体的问题,而SaaS软件,则所有的客户立刻都遇到问题。只要犯一次错,所有的客户都知道了。

所以SaaS企业往往特别强调他们的服务的稳定性,通常宣称的指标就是5个9,既到达99.999%的高可用性。用一个更直观的说法就是,一年之中,故障时间小于8.76小时。因为全年有365×24=8760个小时,乘以0.001就是8.76小时。

通常这个水平是很难到达的,其影响因素包括网络、硬件、软件、数据库和人员执行等各方面问题。现在最好的SaaS公司大约达到99.990-99.998之间。

建议CSDN迅速采取行动,改善现在糟糕的Hosting能力。

Trackback: http://tb.blog.csdn.net/TrackBack.aspx?PostId=807108


原创粉丝点击