服务器 频道

HPE与美国能源部共建新超算,基于ARM架构

  【IT168 资讯】在几周前,美国能源部正式公布了其新一代超级计算机——“Summit”,这个消息想必大家都已有所耳闻。据称,其运算性能可达到200PFlops,合作伙伴是IBM和英伟达。

  美国今年在超级计算机方面的动作不止一个Summit。据外媒报道,本周早些时候,HPE和美国能源部宣布将安装一台名为Astra的超级计算机,可能最早会在今年夏天结束时完成,虽然无法确定具体时间,但可以肯定的是在今年年底之前。

  该系统将被美国国家核安全管理局用于运行建模和模拟工作负载,以解决国家安全、能源和科学等问题。

美能源部与HPE共建新超算,基于ARM架构

  Astra将成为目前世界上最强大的基于ARM的超级计算机

  Astra的理论运算性能峰值可达到2.3PFlops,跟Summit与我国的神威·太湖之光(93.9PFlops)比起来,前者的性能确实有点不够看,但它也有自己的独到之处。

  “它不是世界上最强大的超级计算机,但它是迄今为止最大的基于ARM的计算机。”HPE高级技术集团的副总裁Mike Vildibill在一次采访中表示,“(在全球超级计算机排行中)它仍然在前100名,这是一个非凡的里程碑。据我所知,目前全球超算TOP500中还没有基于ARM的系统,从这我们也能看出美国能源部在将这种新架构带进他们的生产环境方面有多么积极。”

  该系统基于HPE的Apollo 70系统,2U空间,每个包含四台服务器,每台服务器分别使用两个Cavium ThunderX2片上系统。总而言之,该系统将使用5184个CPU来部署2592个服务器,所有这些服务器都使用InfiniBand进行高带宽互连。

  ThunderX2处理器是几个月前才发布的一个相对较新的产品,选择它的一个原因是其内存性能高。HPE声称,该系统将提供比具有更高系统密度的传统系统高出33%的内存性能。内存性能很重要,因为它增强了系统执行超算工作负载的能力。

  Astra将使用Lustre文件系统,这是一种并行文件系统,通过同步的、协调的输入/输出操作(IOPS)提供高性能访问能力。在存储方面,Astra将部署20个全闪存HPE Apollo 4520,连接到一个容量超过400 TB的单一文件系统上。

  Astra系统的功率将达到1.2兆瓦,将使用HPE的MCS 300进行液体冷却,这是一种液体冷却解决方案,安装在Apollo 70机架上。

  Vildibill还提出,使用ARM处理器的决定是美国能源部在开始寻找合作伙伴来设计和建造这个系统之前做出的,这表明,美国能源部的这个项目就是冲着ARM去的。

  如上面所说,在全球顶尖的超级计算机运算性能达到百级PFlops的当下,Astra的表现并不算亮眼,但它“ARM系最强超级计算机”的身份不可谓不特别,而ARM架构在超算领域的潜力也有待挖掘。

  抛开竞争关系,美国能源部积极使用新架构来满足不同生产环境的需求的这一做法是值得肯定的。其实对超级计算机进行排名,更多为了让我们能够更好地认识这些“国之重器”,建设超级计算机耗资巨大,不能只为争一口气,要从实际情况出发。当然,对运算性能的追求也理应是无穷无尽的。

  特别值得一提的是,我国的下一代超级计算机——“天河三号”也在研制中,这是我国新一代百亿亿次超级计算机(又称“E级超算”),它采用了自主CPU、自主操作系统和自主互联通信,可以说是自主程度最高的我国超级计算机;从目前的进展情况来看,“天河三号”有望在2020年研制成功。到时,在研究人员的努力下,它将能发挥自身的最大价值。

0
相关文章