服务器 频道

数字解读曙光5000应用领域及11大技术特点

十一大特点

    曙光5000A系统峰值运算速度达到每秒230万亿次浮点运算(230TFLOPS),LINPACK运算速度超过每秒160万亿次浮点运算,是目前国内速度最快的商用高性能计算机系统。曙光5000A使中国成为继美国之后第二个能制造和应用超百万亿次商用高性能计算机的国家,也表明我国生产、应用、维护高性能计算机的能力达到世界先进水平。该系统在大规模机群计算和网格使能技术方面有所突破,形成了鲜明的技术特色,将我国通用高性能计算机系统的研制水平提升到一个新高度。

(1) 突破230万亿次峰值运算能力

    曙光5000A采用国际高性能计算机主流的机群结构,整个系统规模达到1650个节点,每个节点为4CPU的4核SMP系统,采用AMD Barcelona 2.0GHz处理器,峰值运算速度为230TFLOPS。整个系统通过两套网络互连,包括Infiniband、千兆以太网。系统的主要配置如下:

   230T FLOPS峰值运算速度
   6600个CPU
   1650个结点
   100TB内存
   700TB存储
   两套互联网络
   曙光Gridview机群软件

(2)高密度

    对于大规模高性能计算机系统而言,如何提高系统密度并降低功耗是研制人员面临的关键问题之一。为提高曙光5000A的系统密度,中科院计算所联合曙光公司,研制了具有自主知识产权的4CPU 4核高密度刀片主板和基于该主板的世界上第一款7U高度的10片4路4核64位CPU的工业标准刀片服务器。该刀片服务器可以实现单机箱40CPU,160核的超高计算密度,并实现了单节点内部的并行计算。

(3)全自主

    中科院计算所联合曙光公司自主设计了包括主板,体系结构,刀片服务器,刀片机箱系统,网络交换系统,水冷散热系统在内的全部系统。曙光5000A的设计也完全符合中国刀片服务器标准。在自主创新的研制过程中,曙光在业界实现多个第一:

首次实现了4路16和的高密度刀片系统,
首次实现了单刀片机箱40克CPU的高密度机箱设计,
首次实现了基于DDR的Infiniband的交换结构,实现了20GB高速互联和小于1.3us的低延迟。
首次采用了水冷散热系统,降低了高性能计算机对机房系统的要求,降低了系统功耗。

(4)高效能

    由于采用高密度服务器,曙光5000A能大约75平方米的占地面积内聚集230万亿次的计算能力,而其满负载运行时不带水冷系统功耗只有700千瓦,代水冷系统的功耗仅为1000千瓦。这一方面提高了机群系统的可扩展性,另一方面降低了整个系统地运行成本。

(5)高速互联

    曙光5000A采用基于DDR的 Infiniband高速网络实现计算网络和存储网络合一。实现了20GB的节点间传输速度,实现业界最快的小于1.3us延时。

(6)应用广泛

    曙光5000A不仅可以应用于高性能计算,还可以应用于信息服务,电子政务,网络游戏等常见商业应用。

    在高性能计算领域,曙光5000A可广泛运行证券指数计算、电力安全评估、建筑工程抗震性评估、天气预报、石油地震资料处理、核能开发利用、汽车碰撞、电磁辐射、计算流体力学、基因匹配与拼接、蛋白质结构分析和材料科学等20多个应用领域。

    在商业应用方面,由于曙光5000A使用Suse Linux 和 WCCS ,可广泛运行目前Linux和Windows下的主流的行业软件.

(7)节能

    曙光积极响应世界环保组织节能减排得号召,在曙光5000A中采用了多项节能措施,使曙光5000A在满负载运行时不带水冷系统功耗仅700千瓦,带水冷系统的功耗仅为1000千瓦。

采用了低功耗的CPU,每年节电55万度
采用了低功耗的内存,每年节电5万度
采用了刀片结构,电源效率优化,每年节电100万度
采用了水冷散热体系,每年节电200万度
采用了曙光自主研发的自适应功耗管理软件, 每年节电200万度

(8)高效冷却系统

    曙光5000A首次采用了水冷系统,通过使用水冷系统,降低了高性能计算系统对客户机房的要求,同时提高了冷却效率。水冷系统的设计实现了水电分离,保证了系统的安全性。同时水冷系统还包括备份的被动散热系统,可以在水冷失效的情况下保证系统的正常运行,提高了系统的稳定性。

(9)高性价比

    通过选择AMD Barcelona和自行研制的主板,曙光5000A的价格优势更是十分显著,是新型信息化思路的产物,能大幅降低高性能计算机的成本,使曙光5000A具有很好的性能价格比。

    在曙光5000A的研制过程中,曙光公司延续了以往艰苦奋斗的精神,使得曙光5000A具有极高的性能价格比。实现230万亿次的计算速度的曙光5000A总造价约2亿元。

(10)自主创新的管理软件

    在大型机研制过程中,曙光不仅追求最快,同时也在系统管理方面最求完美。曙光5000A中,曙光自主开发了Grid View集群管理管理系统。曙光新一代Gridview大型机综合管理系统提供统一的集中式监控平台,具备可扩展性、集成性、可靠性和易用性,提供对各种商用、自己研发的管理工具的集成接口,包括直接以Portal的方式集成和抽取各已有管理工具的监控数据以便上层平台能够分析利用,从而满足同时对分布式广域\局域网高效能百万亿次可扩展计算机的环境、硬件、软件等各方面进行监控的需求。

    曙光Gridview大型机综合管理系统具有高可靠性,具有一定容错性和健壮性,使得当部署运行环境等发生异常时系统能够运行在可控的范围内,并进行准确的异常定位提示。系统具有易用性,提供简单灵活的系统部署,人性化的界面和功能设计,方便最终用户的使用,包括灵活方便的个性化设置、多样的内容展现形式。管理系统同时提供个性化、自定义报表输出功能。曙光新一代GridView可有效解决大型机管理的复杂性问题,保障了管理的扩展性、可靠性、自主性和贴近应用需求。

    Grid View管理系统不仅适用于曙光5000大型群集系统,也是用于全系列的曙光服务器。

(11)与国际厂商AMD、微软战略合作意义重大

    通过曙光5000A项目,计算所、曙光公司与AMD公司进一步加强了战略合作关系。采用AMD Barcelona处理器,使中国用户能更早地、更廉价地、更容易地得到64位计算能力;同时引入充分竞争,为中国用户带来更多的技术选择,更大的价格利益,并从国家利益的高度有利于改善中国计算机产业的格局。

    通过曙光5000A项目,曙光公司与微软公司建立了战略合作关系。采用微软的WCCS服务器,提供了用户的管理友好性,同时也让曙光5000A可以运行Windows下的大量行业软件。

0
相关文章