服务器 频道

见证风起云涌 回顾报道中的感悟

   鉴证国内高性能计算的飞跃

    从08年8月份曙光5000A超级计算机正式生产完毕下线以来,这台每秒200万次的机器就成为国内高性能计算的标杆产品。在针对5000A的一系列报道中,印象最深刻的要数独家揭秘曙光5000A在中科院超算所的安装现场了(详见:IT168独家揭秘曙光5000A安装现场)。

    5000A在中科院计算所地下一层的一个巨大房间中安置着,我带着摄像机去的时候,正赶上微软美国的摄制组在拍摄这台64个机柜的超级计算机。现场与他们沟通了一下,他们来拍摄曙光5000A的目的是为了用作Windows Server 2008的宣传。

    在拍摄间隙,与工程师的沟通中我们知道,曙光5000A在中科院计算所的安装调试工作还兼具着跑linpack测试--到了08年12月,曙光5000A凭借每秒200万亿次的计算能力荣登世界超级计算机排行榜前十名。虽说采用了封闭式内循环风冷、外部水冷散热系统,但是曙光5000A在房间内发出的轰鸣声仍然非常大,以至于我们录制视频时采用的降噪麦克风也仍然可以拍到背景噪音。

    由于每个节点插了10个刀片,每个刀片又是四路,每一路CPU又拥有8G内存,因此我们经常看到有某节点的故障灯亮,然后工程师去卸下某个刀片,更换其中的内存条--在这样的高强度、高密度运算中,内存条非常容易出问题。现场的内存条是成箱成箱的,每条都是4GB容量的超大内存。

未公布的图片:为曙光5000A的某个刀片更换内存(一大盒内存条)

    如果说5000A是超大规模高性能计算的代表,那么PHPC个人高性能计算机就显得更贴近我们生活。最初在发布会上见到它,觉得这就是一个微缩版的机架式服务器。但由于个人高性能计算这个概念国外也是刚刚兴起,因此曙光的PHPC显得颇为前卫,我发起了视频拆解PHPC的策划,邀请曙光技术支持中心高性能计算的首席工程师戴荣博士来到我们IT168演播室,详细解析PHPC的神奇之处。(详见:曙光PHPC个人高性能计算机拆解

    戴荣博士讲得很好,拆解过程也相当顺利。PHPC采用的全模块化设计最大限度的保证了高性能计算的可靠性和便利性。令我印象深刻的是PHPC背部的网络模块,可以根据需要替换infiniband网络或千兆以太网模块等。而PHPC采用的Windows HPC server系统,当时还处于beta版本,其对PHPC中各节点的管理令人对Windows系统产生了耳目一新的感觉--这也更符合PHPC面向个人、实验室和中小企业的定位--相比Unix机器更易于用户操作。

    今年曙光宣布研发计算能力达到每秒千万亿次的超级计算机,并计划采用国产龙芯处理器。虽然龙芯与主流处理器相比单颗并没有优势,但是由于其低功耗和开源基础架构优势,使得在超级计算机这种大规模应用中可获得更高的能效比。期待国内高性能计算可以再自主研发自主创新的道路上攀上更高的台阶。

0
相关文章