服务器 频道

节能!高性能计算机要变“绿”

节能降耗是HPC不可缺少的一部分

     针对如何有效解决超大处理中心的高密度机架的绿色供电、散热、高功耗问题,利用风道设计、智能冷却、能量智控等技术,建设绿色数据处理中心,已经成为全球主要HPC制造商的关注焦点之一。

    曾宇介绍说,从最新的全球高性能计算机TOP500排行榜可以看出,目前高性能计算机呈现出以下趋势,即刀片服务器步入泛应用期,服务器节能技术趋于成熟,以虚拟化技术为基础的效用服务器浮出水面,可重构计算显露身手,个人HPC成为新宠儿。而节能已经成为这些技术中不可缺少的重要因素。为了提高HPC的每瓦特性能,我们需要从芯片级、系统级和基础架构级等多个层面来研究开发节能技术,节能已经成为未来千万亿次计算机研发中必须逾越的一大障碍。


    在芯片层面,英特尔的EIST、AMD的PowerNow!、IBM的高热传导界面芯片冷却技术以及上海澜起科技的AMB芯片等都提供了非常出色的节能技术。如AMD Barcelona可以动态地进行电源管理,对核心和内存控制器提供分离的电源供应,对每个核心单独调整到MHz,自动关闭不使用的逻辑电路区域等。英特尔更是在工艺和晶体管材料上做出了重大改进,如今年11月推出的Penryn处理器采用了45纳米工艺,用高-K材料代替传统的硅,使得摩尔定律得以再延续10-15年。

    值得一提的是,随着多核CPU的发展,服务器中的内存容量越来越大,内存子系统也因而成为能耗大户,特别是对于采用FBD全缓冲内存的架构而言。由于每个FBD内存条的功耗为9瓦特左右,如果配上32条内存,其总功耗就接近300瓦特,远远大于CPU和芯片组的能耗。功耗增加不仅导致内存温度升高,散热成本增加,而且会影响到可靠性,并缩短器件寿命——在室温(21度)的基础上,每增加10度,可靠性就会降低50%。对于FBD内存而言,其核心芯片AMB是整个系统中功耗最大的器件群。上海澜起科技董事长杨崇和介绍说,澜起科技已成功研制出了新型的AMB芯片,和目前市场上的AMB相比,新型AMB可节能30-50%。

    在服务器系统软硬件层面,许多服务器厂商在研究如何进一步提高电源使用效率,基于负载情况动态调整节点状态,根据不同用户进程能耗的不同进行CPU任务队列的调度,将一些产生较多热量的任务从温度较高的CPU上迁移到温度较低的CPU上。如曙光自适应功率管理软件可以根据效率曲线来动态关闭和打开电源,与监控系统和调度系统相结合,可以探测空闲资源,通过降低CPU频率、关闭CPU核心等手段来降低空闲资源的能耗,据中石油BGP测试可降低25%的能耗,该技术将会被应用到下一代超级计算机曙光5000中。

    英特尔公司技术专家Joseph Tsang则谈到,由于UPS、PSU、服务器风扇、VR等部件在实现交直流电的转换过程中,往往会损失掉一部分效能。在传统的系统设计中,能源效率只有48%,即每输入1瓦特电能中损失了52%;而如果通过优化设计,比如去掉一些转换器之后,能源效率可以提升到76%,而且更少的部件也意味着更高的可靠性。

    除了芯片层和系统层,在数据中心的基础架构方面同样有很多可创新之处。比如,在一些老的数据中心里,热风与冷风往往混杂在一起,气流不够科学,从而影响散热,而如果将热风区和冷风区隔离开来,就能大大提升散热效果。虚拟化也能起到节能的效果,通过整合,将原来分别运行在多台服务器上的应用整合到一台服务器上,不仅能减少服务器数量,降低能耗,还可以通过动态负载均衡来实现虚拟机的迁移,提高系统高可用性。此外的节能技术还有液体冷却、金属冷却、智能温控风扇等等。


    其实,在过去几年里,技术进步已经为高性能计算机带来了更好的每瓦特性能和每平方英尺性能。Joseph Tsang举例说,2002年为了实现3.7 Tflops的性能,需要25个机柜、512台服务器,占地1000平方英尺,用电128KW;而到2007年,同样是实现3.7Tflops的性能,仅需要一个机柜、53个刀片,占地仅40平方英尺,能耗只需21KW。但面对未来的百万亿次和千万亿次计算时代,我们要做的工作还很多。

    除了技术创新,还应该制定出有效的低功耗标准。美国电子器件工程联合委员会存储器委员会(JEDEC)主席罗丹德认为,计算机已普及并影响到更多的产品,而数据中心又是计算机使用中增长最快且用户群最大的工具之一,制定低功耗标准已是迫在眉睫。据悉,高标委目前正在制定刀片服务器的一系列标准规范,而且计划明年会针对石油、气象等行业推出高性能计算行业应用标准。 

    综上所述,随着高性能计算机规模越来越大,能耗问题也会越来越突出,从而直接影响到了用户TCO的构成。对于整个行业来说,大规模数据中心和计算中心中的高性能计算机也已经成为能耗大户,从而也会影响到社会的效益。因此,高性能计算机的节能减排受到了政府、企业和用户的多方关注。

0
相关文章