节能!高性能计算机刻不容缓

来源:互联网 发布:flexsim仿真软件 编辑:程序博客网 时间:2024/04/19 13:29
 
11月21日,在信息产业部科技司的指导下,由中国电子工业标准化技术协会(简称中电标协)、中国电子技术标准研究所主办,由中电标协高性能计算机标准工作委员会(简称高标委)和上海澜起科技有限公司协办的中国高性能计算机节能技术标准与应用研讨会在北京举行。来自信息产业部科技司、中电标协、高标委等政府机构以及英特尔、澜起科技、曙光等公司的代表出席了会议。信息产业部科技司司长韩俊在研讨会上表示,“建设环境友好型、资源节约型社会,信息产业部应当有所作为,也能够大有作为。”
 
据统计,2006年我国规模以上电子信息产品制造业综合能源消耗量为1357万吨标准煤,万元增加值能耗为国民经济平均水平的1/7,为工业平均水平的1/15。但是,对于一些大型数据中心、大型运算中心而言,由于服务器、高性能计算机都是集中、批量地部署,其节能减排工作已经刻不容缓。
 
高性能计算机已成“电老虎”
近年来,随着计算机硬件成本大幅降低,加上Linux集群优势突出,用户部署的高性能计算机系统规模越来越大,节能降耗也因此成为厂商和用户不容忽视的一大课题。2004年落户上海超算中心的10万亿次曙光4000A目前仍是国产最快的超级计算机。高标委主任、曙光总裁历军在会上介绍说,“这台机器每年光电费就要400多万元,平均每天就是一万多。2008年我们还会推出每秒运行100万亿次的机器,如果还按照现在的情况,光是能源的消耗就会远远大于超级计算机自身的价值。因此,在下一代高性能计算机的设计和研发过程中,必须解决好节能降耗的问题。”
 
跟上海超算中心比起来,中石油东方地球物理公司(BGP)数据中心的电耗成本更是高的惊人。该公司总工程师赖能和谈到,从2002年到2007年,BGP所拥有的CPU数量、总体运算能力、总存储容量分别增长了40倍、7354倍和300倍,现在拥有1万多颗CPU规模的数据中心的电费总支出每天要4.8万元,因此每年光电费成本就高达1700多万元。
 
面对高额的数据中心电耗成本,BGP已经采取了一些措施,比如改进高密度机房制冷技术,定向调节风量、风向和风速,根据空调的风向和距离调整机柜的方位和机房地板,空调直接对设备制冷等等。高额的用电量和用电成本甚至让一些拥有更大规模数据中心的企业如Google、腾讯开始或筹划自建发电站。
 
对于服务器使用量较少的中小企业来说,能耗问题也同样不容忽视。有统计数据表明,现在一台服务器3年内所消耗掉的电力成本可能会超过服务器当初的采购成本。斯坦福大学的一项研究显示,2005年美国用于服务器产品上的电费高达27亿美元,占了美国总电费的1.2%,而且值得注意的是,其中服务器本身运行时需要消耗的电力,和制冷、散热等辅助系统所需要的电力二者之间接近1:1的关系。“中国目前有近1亿台笔记本电脑或台式电脑,但我们的服务器保有量大约是200万台,这个比例还远远没有达到发达国家的水平,比如美国每10台PC会匹配一台服务器,因此,我们还有很大的发展空间,预计能达到1000万台服务器,计算下来,每年就会消耗掉300亿度甚至更多的电能,排放几千吨的温室气体。”高标委秘书长曾宇为与会代表算了这样一笔帐。可见,计算机的耗电不仅会影响到用户的利益,也关系到整个社会的可持续发展。
 
高性能不要高耗能
 
针对如何有效解决超大处理中心的高密度机架的绿色供电、散热、高功耗问题,利用风道设计、智能冷却、能量智控等技术,建设绿色数据处理中心,已经成为全球主要HPC制造商的关注焦点之一。
 
曾宇介绍说,从最新的全球高性能计算机TOP500排行榜可以看出,目前高性能计算机呈现出以下趋势,即刀片服务器步入泛应用期,服务器节能技术趋于成熟,以虚拟化技术为基础的效用服务器浮出水面,可重构计算显露身手,个人HPC成为新宠儿。而节能已经成为这些技术中不可缺少的重要因素。为了提高HPC的每瓦特性能,我们需要从芯片级、系统级和基础架构级等多个层面来研究开发节能技术,节能已经成为未来千万亿次计算机研发中必须逾越的一大障碍。
 
在芯片层面,英特尔的EIST、AMD的PowerNow!、IBM的高热传导界面芯片冷却技术以及上海澜起科技的AMB芯片等都提供了非常出色的节能技术。如AMD Barcelona可以动态地进行电源管理,对核心和内存控制器提供分离的电源供应,对每个核心单独调整到MHz,自动关闭不使用的逻辑电路区域等。英特尔更是在工艺和晶体管材料上做出了重大改进,如今年11月推出的Penryn处理器采用了45纳米工艺,用高-K材料代替传统的硅,使得摩尔定律得以再延续10-15年。
 
值得一提的是,随着多核CPU的发展,服务器中的内存容量越来越大,内存子系统也因而成为能耗大户,特别是对于采用FBD全缓冲内存的架构而言。由于每个FBD内存条的功耗为9瓦特左右,如果配上32条内存,其总功耗就接近300瓦特,远远大于CPU和芯片组的能耗。功耗增加不仅导致内存温度升高,散热成本增加,而且会影响到可靠性,并缩短器件寿命——在室温(21度)的基础上,每增加10度,可靠性就会降低50%。对于FBD内存而言,其核心芯片AMB是整个系统中功耗最大的器件群。上海澜起科技董事长杨崇和介绍说,澜起科技已成功研制出了新型的AMB芯片,和目前市场上的AMB相比,新型AMB可节能30-50%。
 
在服务器系统软硬件层面,许多服务器厂商在研究如何进一步提高电源使用效率,基于负载情况动态调整节点状态,根据不同用户进程能耗的不同进行CPU任务队列的调度,将一些产生较多热量的任务从温度较高的CPU上迁移到温度较低的CPU上。如曙光自适应功率管理软件可以根据效率曲线来动态关闭和打开电源,与监控系统和调度系统相结合,可以探测空闲资源,通过降低CPU频率、关闭CPU核心等手段来降低空闲资源的能耗,据中石油BGP测试可降低25%的能耗,该技术将会被应用到下一代超级计算机曙光5000中。
 
英特尔公司技术专家Joseph Tsang则谈到,由于UPS、PSU、服务器风扇、VR等部件在实现交直流电的转换过程中,往往会损失掉一部分效能。在传统的系统设计中,能源效率只有48%,即每输入1瓦特电能中损失了52%;而如果通过优化设计,比如去掉一些转换器之后,能源效率可以提升到76%,而且更少的部件也意味着更高的可靠性。
 
除了芯片层和系统层,在数据中心的基础架构方面同样有很多可创新之处。比如,在一些老的数据中心里,热风与冷风往往混杂在一起,气流不够科学,从而影响散热,而如果将热风区和冷风区隔离开来,就能大大提升散热效果。虚拟化也能起到节能的效果,通过整合,将原来分别运行在多台服务器上的应用整合到一台服务器上,不仅能减少服务器数量,降低能耗,还可以通过动态负载均衡来实现虚拟机的迁移,提高系统高可用性。此外的节能技术还有液体冷却、金属冷却、智能温控风扇等等。
 
其实,在过去几年里,技术进步已经为高性能计算机带来了更好的每瓦特性能和每平方英尺性能。Joseph Tsang举例说,2002年为了实现3.7 Tflops的性能,需要25个机柜、512台服务器,占地1000平方英尺,用电128KW;而到2007年,同样是实现3.7Tflops的性能,仅需要一个机柜、53个刀片,占地仅40平方英尺,能耗只需21KW。但面对未来的百万亿次和千万亿次计算时代,我们要做的工作还很多。
 
除了技术创新,还应该制定出有效的低功耗标准。美国电子器件工程联合委员会存储器委员会(JEDEC)主席罗丹德认为,计算机已普及并影响到更多的产品,而数据中心又是计算机使用中增长最快且用户群最大的工具之一,制定低功耗标准已是迫在眉睫。据悉,高标委目前正在制定刀片服务器的一系列标准规范,而且计划明年会针对石油、气象等行业推出高性能计算行业应用标准。
 
政企联手打造节能生态环境
随着中国PC、服务器等计算设备市场保有量的不断增加,计算机的能耗问题也引起了政府机构、企业和专家学者的广泛关注。近几年来,信产部在节能降耗方面开展了大量工作,如研究建立了电子信息产业节能监控体系,组织修订了《电子工业炉窑能耗等级标准》,组织开展节能产品的推广应用,推动废旧电子产品的综合利用,加强电子节能技术的宣传引导等。下一步信产部还会推出《关于加强电子信息产业节能减排工作的指导意见》及其他鼓励企业加强节能减排工作的切实举措。
 
随着高性能计算机规模越来越大,能耗问题也会越来越突出,节能问题已经刻不容缓。只有从政府、企业各方面加大制定节能制度、完善节能措施,才能保证高性能计算机领域的科学发展,构建高性能的绿色生态环境。
 


原创粉丝点击