跨领域的智能云管理平台-孙立辉(云平台 CSM)

来源:互联网 发布:mac 安装win分区 编辑:程序博客网 时间:2024/05/21 09:41

跨领域的智能云管理平台

文/孙立辉 杨昂凯

由于信息化水平的快速提高,IT的建设模式已经开始向云模式迁移,越来越多的企业开始尝试部署云计算。云计算的实质是简单化、平台化和服务化。在云管理平台上企业IT所涉及的资源能够以服务的形式提供,不仅提高信息业务上线速度,也提高IT运维效率。

 

一、  IT管理的变革

1.     传统的IT管理主要面临以下三个问题

高昂的管理成本:随着IT规模的不断膨胀,数据中心内的服务器数量、网络复杂程度以及存储容量急剧增长。IT运维管理人员的工作强度以及工作难度都不断增加,为了继续维持企业IT的稳定运转,企业只能投入大量的人力成本到IT运维管理。

缓慢的业务部署速度:IT部门无法快速响应业务部门。因为新的服务器、存储设备和网络设备的部署周期较长,整个过程包括硬件选型、采购、上架安装、操作系统安装、应用软件安装、网络配置等。

管理平台繁杂:为保证设备异构性,企业IT从计算、网络、存储以及虚拟化各个层面都存在多厂商并存。各厂商的管理平台各不相同,管理平台的数量急剧增加,管理复杂度也随之加剧。

 

2.     解决IT管理问题的新思路

通过虚拟化技术提高IT基础设施的利用率,从计算虚拟化、存储虚拟化,到网络虚拟化、L4~L7层服务虚拟化,以降低成本、提升IT运行灵活性。

企业IT 实现基础设施即服务的IaaS云,将计算资源、存储资源以及网络资源进行池化,以服务的方式对外提供IT基础设施,并部署跨领域的统一管理平台,对池化资源进行统一管理。

 

二、  跨领域的云服务管理平台

为了实现跨领域资源统一管理的目标,H3C iMC CSM云服务管理平台应运而生。CSM融合了从终端到网络到云计算的服务模式,全面实现SaaS、PaaS、IaaS层对接能力。

 

1.     iMC CSM云管理平台架构和特点

云平台在IaaS层实现云计算、网络和存储资源的虚拟化,这些资源可能分布于不同的机房,通过将资源池化,实现对资源的统一调配;通过基础资源管理组件,实现对资源的自动编排和配置、安全控制、性能监控、运维操作、计费权限等基础设施虚拟化管理。

PaaS层提供更专业和通用的数据管理和应用支撑,不单单是孤立的运行环境的搭建,而是要考虑数据库的集群、不同技术的应用框架的兼容(Java,.net)、高效的中间件(分布式文件系统)等等。而这些努力都是为了对外提供应用。

SaaS业务服务基于基础设施的资源和应用支撑框架,将不同的应用运行的在统一的平台上,而不去关心底层的技术框架、数据库类型、计算存储的差异。

智能云平台的统一门户可以让用户的终端设备方便的在应用超市选择应用并使用服务。

 

2.     灵活全面的统一服务台

多级、多维度的租户及组织结构管理


图1 多维度组织架构

组织架构定义是云平台的基础,几乎所有的云平台要适应政府、企业、行业等不同的定制需求。云平台支持定制多级组织嵌套,每级组织都会划分资源(CPU、内存、存储、网络等)和用户(如图1所示)。

提供了多种用户的角色,各用户的功能视角也不同。iMC运维管理人员专注于对池化资源的部署分发、服务编排、应用监控,定制流程和计费模板;企业和政府的领导或者IT主管作为私有云(或私有云下某个组织)的管理员,关注云容量的规划、服务的质量评价、计费营账报表以及绩效考核。对于终端用户,更关心vDC服务的申请、流程审批、工单问答以及实时账单等。

用户通过网络进行二层隔离,每个网络都设定了V(x)LAN标识和IP地址池规划。用户可以使用多个网络以支持不同场景的业务的隔离需求。

客户化运维、审批和工作流程

云平台有一整套面向企业IT网络运维服务的管理解决方案,关注ITIL 服务生命周期中关键的服务转换和服务运营部分,聚焦于和IT 网络基础架构管理关系紧密的运维流程的支持能力。通过流程化管理能力,使所有的IT 运维活动(比如配置的变更、故障问题、审批流程的处理)做到可控、可度量、可审计。

在统一的配置管理数据库(CMDB)、自定义流程框架、自助服务台框架所提供的自动化运维能力基础上,提供了ITIL 服务运维领域完整的资产管理、配置管理、变更管理、请求/事件/故障管理、问题管理、知识库管理等功能,并提供Service Desk 作为IT 网络服务的统一管理门户。2 IT网络服务的统一管理门户

比如审批是所有企业和政府机构最常见的流程,同时也是个性化最强的业务,需要让云平台服务申请的审批能适应不同政府部门和企业的需要。云平台将审批定义为包含多个有序任务的流。可以定制不同的流程模板,模板支持多级审批,可以定制个性化的审批页面,最大程度满足用户的定制化需求。用户可以将模板与对应的审批流程绑定,不同的审批可以绑定不同的定制流程。

丰富的IaaS/ DBaaS/PaaS/SaaS云服务

云平台不但提供了传统的云主机、云硬盘服务,在安全服务上推出了vFW和vLB服务,为用户的vDC保驾护航。基于Openstack的Swift组件,云平台对外提供云存储功能,用户可以申请存储空间并通过云平台进行文件管理。还可以安装客户端,将云存储与本地关联,仿佛云存储就是用户本地的一块磁盘,更方便的进行文件管理操作。

Swift使用标准化的服务器存储 PB 级的访问数据。它并不是文件系统或者实时的数据存储系统 ,而是一个用于存储永久类型的静态数据的长期存储系统 ,这些数据可以检索、调整、必要时进行更新。

除了IaaS/PaaS/SaaS服务外,云平台提供了丰富的数据库服务,不但支持MySQL、SQLServer等多种数据库类型,还支持数据库HA方案和数据自动化备份方案,实现业务的零中断和数据的零丢失。数据库在网络端也进行了二层V(x)LAN隔离,满足租户间的安全隔离要求。

 

3.     端到端的云服务编排

基于vDC服务编排

除了传统的购买单个主机vHost、单个应用vApp功能外,云平台重点体现的是定制vDC服务。通过服务编排打通端、网、云,生成以应用为中心的虚拟数据中心服务模板,对服务的生命周期进行管理。

在vDC中,用户可以定制(IaaS层)主机、存储服务,通过关联vLB来实现负载均衡;申请(PaaS层)不同型号的数据库服务,与主机对接;同时选择云平台提供的应用蓝本定制需要的(SaaS层)软件/应用服务。

在网络安全方面,用户可以自主的规划私网网段,设定vFW的域间策略实现防火墙安全隔离,甚至可以为应用申请公网IP,支持互联网外对服务的使用。用户无须关心如何打通网络(云平台会自动部署),只需关注服务本身,通过云平台统一界面实现服务的操作和访问,甚至还能从云平台获取服务的监控统计数据,时刻关注服务的质量。

 

基于应用的服务蓝本设计


图2 基于应用的服务架构

(如图3所示)在vDC中,用户最终直接使用的是应用,通过编排对用户需要的操作系统、应用和数据库进行自动部署,并生成服务蓝本,供更多用户重复申请使用。在应用超市中,提供各种基于应用的服务模板,用户通过鼠标操作即可以在自己的云主机上部署需要的软件和应用。

面向应用的监控和资源动态调整

当前由服务器、数据库、中间件等组成的应用信息系统越来越复杂,各种突发故障排除起来也越来越困难。基于最新的Agentless(无监控代理)技术,无需在被监控的服务器上安装监控代理,就可以通过Telnet、SNMP等方式,对关键应用或资源进行远程监控,避免安装监控代理后对服务器造成的影响。提供强大的系统与应用监控管理能力,可以对不同的业务系统、应用和网络服务(如服务器、操作系统、数据库、Web服务、中间件、邮件、其他关键应用等),进行远程监控和管理,从而充分满足用户对各种关键业务和数据中心的监控管理需求。

通过应用的监控数据动态的对虚拟资源进行调整以满足服务质量和资源利用的最优化。在应用监控的基础上,结合告警、报表等功能,对网络中的所有应用进行可用性和健康度评价,帮助网络管理员了解网络应用的运行状况,并及时发现网络应用的隐患。

三、  综合云自动化运维体系


图3 智能云管理中心展示

用户在前端享受着高质量的服务,在云的内部则是智能云管理中心在保障着资源的稳定运行。智能云管理中心提供了云网全拓扑展示(如图3所示),在拓扑上管理员可以查看虚拟机、虚拟网卡、虚拟交换机与物理交换机的连接关系。管理员可以管理云中的物理资源和虚拟资源,虚拟机迁移、数据和配置备份,以及资源的性能指标监控。使用系统预置的报表模板的同时,用户还可以自定制报表模板,生成个性化的云网融合报表。通过大屏可以时刻监视机房的状态。

 

1、端到端基础架构巡检与优化报告

通过基础架构模板适配层,兼容管理多厂商产品和协议,通过定制脚本,针对云中资源的配置和运行状况进行定期的巡检,在机房topo中准确定位到出问题的设备。基于端到端的配置检查,生成合规报告,列出可能存在的问题(例如监测密码是否太简单,CPU使用率是否过高等),根据预先设定的规则对云数据中心进行健康度评价。

 

2、容量预测与定制化运维绩效考核

云中的资源都是通过虚拟化的方式进行了池化,将物理数据中心分解成一个资源池,池中包含着CPU、内存、存储、VLAN、IP等资源,每一项资源就对应了一种服务。通过对池中资源进行统计,生成Chart和报表,便于管理员分析和统计当前的容量使用情况。通过性能趋势、前瞻性和扩展预测可以清楚了解目前及未来的资源需求和使用情况,帮助管理员及时的进行容量管理和规划。

绩效考核是对云运维团队的差别化激励的重要手段,也是对云服务质量的侧面体现,在智能云平台中针对工单处理打分、服务健康评价、运维故障响应和安全容灾合规等多方面综合考虑对运维绩效进行考核。其中故障响应和服务水平是云服务质量的重中之重。

除了通过巡检定期排查问题外,管理平台还对设备的告警、syslog等进行监控,第一时间发现问题。同时基于iMC的性能、NQA链路监控,NTA网络流量分析等业务,提取关键性能指标(KPI),建立服务各个方面质量的度量指标(KQI)以及服务整体质量的度量模型(SLA),基于服务可用性、MTTR平均修复时间、MTBF平均无故障时间等的监控和分析对服务的健康水平做出评价。

 

3、客户化计费和营账方案

不同的政府部门和企业有各自的计费策略,要能适应定制化的计费需求,满足不同拨款和结算需求。计费分为不同纬度,云运营商向客户收费既要整体的费用统计,还要每项费用的细节报表。客户内部可能是一个集团或一个省政府,其内部的子部门是实际使用服务的用户,可能不需要实际收费,但是也需要详细的帐目,便于内部的营账和结算。不同纬度之间的项目收费额可能不一样,这要求云平台能够同时支持不同的计费模式。

智能云平台允许用户自定义计费模板,为不同的服务定价。同时针对不同纬度的计费,智能云平台可以应用不同的计费模板,运营商给客户的账单和客户内部的账单可以是两套费用统计,满足复杂计费的需求。用户在使用服务时,可以查看实时费用和统计账单,实时费用会根据用户定义计费模板中的最小计费单位进行更新,第一时间了解自己的帐目。

 

4、合规与安全审计

安全是云运维的重中之重,云平台将网络安全资源虚拟化和抽象控制,实现安全域间隔离、防病毒和存储备份等基础功能。针对安全接入问题,对云安全业务部署和策略调整以及日志和行为审计进行了全面的控制。在SaaS层进行应用权限控制、日志审计、信息数据审核、代码级安全分析等,PaaS层提供数据库的安全隔离、平台开发环境安全控制和账户管理等防护,IaaS层的租户域间隔离与资源负载、DDos流量清洗和IPS入侵防护、云主机扫描杀毒等。云平台还提供了自动化脚本,对环境中的安全合规隐患进行定期排查,生成分析报表,第一时间上报问题告警。

 

四、  可靠易扩展的标准开放的云架构

为了实现大规模资源管理,同时支持业界标准,智能云平台基于Openstack的标准框架开发。通过定制Nova(计算)、Cinder(块存储)、Neutron(网络)、Glance(镜像)和Swift(对象存储),提供南向接口与不同厂商的hypervisor和基础设施对接,实现对IaaS层资源的管理。在Keystone的基础之上丰富了租户的组织结构关系,满足政府和企业的复杂的行政关系。

基于通用框架,智能云平台制定了标准,如基础架构标准、应用蓝本标准、业务迁移的标准。这样标准的架构可以同时满足私有云、公有云和混合云的模式,无论在任何场景中,数据和业务都可以灵活的迁移并应用于第三方标准平台。

云平台的功能都提供业界标准的Swagger REST API,用户可以通过统一的门户去购买服务、填写工单、查看账单、性能报表,而统一的门户功能正是各组件通过标准API互动实现的。客户甚至可以定制自己的页面风格,使用API实现个性化的功能。第三方的SaaS和PaaS平台也可以调用云平台的标准接口,实现对基础资源和服务的使用。

标准开放的API使得云间资源的共享成为可能,多个云平台之间通过REST互访可以实现云间的资源灾备和迁移,完全解决了传统业务的信息孤岛问题。

 

五、  结束语

H3C iMC CSM云服务管理平台,实现了数据中心的资源的统一管理,实现服务性能和效率最优化;端到端的服务设计、面向用户应用的统一服务台,用户可以快捷的申请IaaS/DBaaS/PaaS/SaaS层的服务,搭建私有的虚拟数据中心;用户可以按自己的业务模式定义业务流程、计费和营账模型以及组织架构,从而为客户提供量身定制的云服务平台,便于用户实施生产、运维和管理。

 

 

 

0 0
原创粉丝点击