【编者按】今天的人们已经无法适应没有网络和计算机的生活,从国内超过美国跃居宽带网络之首到3G无线网络遍地开花的覆盖全国,一系列IT事件在这个经济冬天蓬勃的爆发,业界蒸蒸日上的冲劲隐隐要担当经济发展的龙头角色。然而,不论是维系互联网的大型数据中心,还是小到身边的个人电脑、手机都在面临着能耗、污染等一系列问题--有人寓言再过10年,IT产业将会超过航空业成为全球热量和二氧化碳排放最大的产业。
【IT168 专稿】上周末,在中科院计算所举行了由中国计算机学会青年计算机科技论坛YOCSEF主办,IT168协办的主题为《低排放绿色计算》的报告会。与会的有来自英特尔、曙光、百度和浙江大学的产业界、学术界专家,共同就绿色计算的趋势和面对的问题作出阐释,并结合自身研究方向谈了与绿色计算相关的技术。
详见报道:
首先发言的是英特尔中国研究中心高级主任研究员邓育贤先生,他从芯片的设计角度出发谈了目前英特尔是如何看待处理器功耗,以及目前应用了哪些技术来降低功耗的。邓先生认为:"芯片中的功耗主要分为两大类,一类是随着线程的运算处理器的负载而变化,我们称之为动态功耗,也就是消耗功耗。另一类是静态功耗,也叫漏电,是半导体工艺造成的必然损耗。"
接下来,邓先生具体分析了动态功耗和静态功耗的产生原因。他表示:"对于动态功耗的控制,我们可以拿简单的例子来说,就是我们不能为了追求性能而选择高主频。因为主频一旦上去,功耗也就会变的很大,另外从静态功耗的角度讲,漏电也会更加的严重,这是半导体从摩尔时代起就不断面对的双重矛盾。"
邓育贤先生表示,在英特尔工艺制程的进步当中,每一代工艺进步,理论上都可以做到尺寸减小30%,芯片大小增加15%,同时电压减少15%,频率变为原来的一倍。可是英特尔没有这样做,因为这样做的话会使芯片的功耗变为原来的2.7倍。英特尔在设计芯片的时候,除了会考虑性能,更会考虑芯片的总功耗,因而每个芯片设计部门甚至都有自己的功耗指标。"假设个例子,比如某个芯片设计过程中,规定Cache部门的总功耗不能超过30瓦,然后性能要保证在多少,容量在多少等。"邓先生如此阐述英特尔在设计芯片时的目标设定法。
不过邓先生也表示,由于物理层条件所限,目前的芯片无法再更多的降低自身的工作电压,因此只有从制程上去寻求效能比。他谈到英特尔的45nm技术将漏电控制在了45%左右,而基于45nm技术制造的凌动处理器更是只有2W的功耗,从而大大方便了在嵌入式领域的应用。此外,在软件领域,ACPI标准给了操作系统知晓机器状态的接口,但是硬件层面的设计并没有很好的应用这一点。邓先生表示,硬件和操作系统互相不知道对方需要获得什么样的数据来优化运行功耗。
而另一方面,将功耗送到真正需要的地方,才是我们常说的处理器运算的真谛。邓育贤先生说,英特尔一直在致力于从工艺、软件和平台架构方面来降低系统整体的功耗,前阵子推出的Nehalem 至强5500系列处理器更是在同等效率下节省了50%的电,让用户8个月就可以节省回成本。最后,等先生表示,目前降低功耗的设计是芯片设计中一个主要考虑的因素,而在新的领域,英特尔和清华大学合作研发、建模,力求作出更加环保、节能、低功耗的处理器。
曙光研发中心邵宗有谈高性能绿色计算
曙光公司研发中心总经理邵宗有先生从高性能计算的角度谈降低功耗对大型数据中心的作用以及所采用的方法。他表示,曙光公司作为一个企业,更注重的是走实际路线,而曙光作为国内高性能计算的龙头企业,在超级计算机的研发上更注重的就是节能和功耗管理。
邵宗有先生表示,相比90年代数据中心每平方米只需要100W的电力配给,如今的供电已经大大超出了机柜的负载承受能力。"一个数据中心的机柜经常因为功耗原因闲置一半,尤其是1U和刀片服务器,一个机柜通常都无法插满。"邵宗有先生说,"如果我们不做功耗控制,任由IT设备的功耗上升,那么很多过去的机房都将闲置,需要重新建很多数据中心。"
"因此可以发现,不从节能减排的大趋势讲,也可以发现我们面对着国内数千个IDC的淘汰问题。"邵宗有先生表示,"上海超算的曙光5000A每天的电费是3万人民币,一年就需要1000万人民币交电费。而根据07年的数据,我们的服务器和制冷设备的消耗已经达到了19亿美元。"邵先生认为,谈绿色计算要讲三个方面的内容,分别是对单个计算机采用了哪些功耗控制,然后是对多个计算机一起采用了哪些功耗控制,最后是对于连接这些计算机的基础设施和环境采用了那些手段。
邵宗有先生认为,只有将硬件和软件结合起来,才能有效的控制功耗。他从节点监控的角度谈起,表示监控是节能的基础,只有先做好监控才能知道该如何协调各机器之间的负载,如何在负载少的时候关闭服务器来节省电力。邵先生从基于ACPI的功率走势图开始分析:"频率降低的话,功耗也降低。如果说这个机器没有事可做,可以把频率调得低一点。另一方面就是CPU利用率,性能越高,功率越高。我们可以看到一个问题,性能和功耗并是一个直线,是有拐点的,是这个机器性能本身要做测试,它觉得电的效能,集群耗电是通过这个拐点。"
从应用案例来说,邵宗有先生举了中国石油的例子,他表示,中国石油集团的数据中心具有负载空间的局部性。很多时候负载是比较低的,只有在进行地址计算和石油勘探的时候才会有高负载率。通过ACPI接口,曙光研发的GridView集群管理软件对整个数据中心进行监控,在负载低的时候休眠空闲的机器,使得目前中石油的功耗节约了30%。此外,他还列举了应用虚拟化技术节约电力的例子,表示建立虚拟资源池,利用按需分配的方式动态调配计算资源,也是一种控制功耗的方法--而这取决与调度算法。
从机房的功耗分布,到曙光目前正致力于制定的高性能数据中心标准,邵宗有先生表示,数据中心要发展,节能和智能的功耗控制是大家必然要做好的。而要做好功耗控制,就必须像老子所说的:"天下难事,必做于细。"只有小的地方做好,才能在各个细节领域推动低功耗绿色计算的发展。
百度阳振坤谈数据中心机房节能
阳振坤先生是百度高级科学家,他简单的总结了前两位发言者的观点,从机房和集群建设的角度,结合自己在百度主持云计算数据中心建设的经验,以“云计算绿色之路”为题,讲述了如何应用云计算实现低排放和绿色计算。
阳振坤先生表示:“我们现在用的方式是用云计算方式管理一些集群,所以我们的集群从几台,到几十,几百台集群都在有,曾经有人给云计算下了一个定义,通过互联网把机器放在一个集中化的地方进行应用,集中化机器带来更高效率。大多数服务器利用率只有10%,在集约化会高一些,会达到30%利用率是有必要大大提高,很多人说我们机器忙的时候非常忙,这个是一个人的心理感受,大家会感觉大机器很忙,很慢,但是大家不会注意机器很闲的时候,这些数据都是监控统计出来的,我们目前用的云计算计算是大规模分布式集群,所以我们在一个地方有很多机器,有好几代,有很早,现在开始有曙光,华为机器很多不同的机器和不同的配制。”
阳先生还表示:“关于机房里面有一个叫做电有效性指标,整个机房电用量除以真正的设备,比如说计算机,包括交换机消耗电量比例,空调是机房必不可少的东西,本身也是耗电大户,一个是水冷和风冷,水对热的传导量是风冷是100倍,还有我们大部分机器都是风冷的,但是数据中心其实是不一样,数据中心里面的机器都在一起产生非常大,在数据中心一旦没有空调几乎不可心想,几乎几分钟就完蛋了。”
阳先生最后认为:“大多数都是我们在实际中遇到的问题,目前为止电是最大的一个限制和成本问题,要减少能源消耗,很多事情可以做,计算机本身的耗电量还有空调系统,还有UPS另外整个系统架构,云计算系统架构要有对它有支持,目前云计算架构对这个支持是有限,要整个工业界行动,比如说我们机器要用水冷,电池,这样可以代替UPS,可以减少一些消耗,这个不是几个企业可以做到这件事情的。”
浙江大学陈天洲谈嵌入式系统软件节能技术
作为嵌入式领域的专家,浙江大学的陈天洲教授为我们带来了题为“嵌入式系统软件节能技术”的演讲。陈教授表示,在嵌入式设备中,最需要讲究的就是功耗的控制,因为往往嵌入式设备都是移动或手持设备,电池是有限的。从我们常用的手机谈到嵌入式处理器内部的功耗探测,陈教授认为软件节能技术已经很成熟,但是硬件发展的更快,使得节能的脚步总是落后一些,例如对处理器内部的探测和控制,又如怎样针对低功耗处理器优化程序等都是这方面的课题。
陈天洲教授认为嵌入式天生就要做功耗问题,嵌入式系统定义对功耗有严格要求。低功耗是嵌入式处理器一个特点之一,很少看到嵌入式处理器上面带一个分散,降低的设备,甚至搞水冷处理器上面降温,作为处理器往往要求的是性能提升,往往会推动主频提升,复杂度的提升,所以我们看到这几年做处理器走了一个架构越走越简单。
接着陈教授介绍了嵌入式软件节能的四个主要技术:首先是一个电池建模,通常有一个大容量电池供电技术,对应软件技术怎么样,第二就是外围设备,第三是操作系统,第四是编译器。其中,陈教授重点就编译器方面的节能进行了讲解,他认为:现在编译是以功耗为目标,编译里面可以分三形式,第一是存储优化,存储一直是功耗比较大的,第二是代码分析,第三是编译的互相支持。
最后,陈教授表示:目前低功耗软件设计还是有很多不足,第一节能在软件开发流程是在哪个环节里面,现在不是特别清楚,作为软件公司也不希望在某个环节里面突然冒出第二个目标干扰原来软件设计的目标或者设计说明说,第二程序员要不要关注这个事情,程序员做系统软件人能收集到很多信息。这些东西拿到以后程序员能不能完成这些东西,但是很多程序员说这个事不是我的事情,还有操作系统编译器加了节能以后,你安全吗,可信度是不是降低了,实时性是不是降低了,会不会有这个影响。