服务器 频道

图解天河一号千万亿次超级计算机细节

  【IT168 专稿】作为我国高性能计算领域的顶级峰会,HPCChina年会每年举办一次。10月29日-31日,2009年全国高性能计算学术年会(HPCChina 2009)在湖南长沙举行,此次大会由中国计算机学会高性能计算专业委员会主办,中国软件行业协会数学软件分会协办,国防科技大学承办,来自全国各地的300多位高性能计算从业人员参加了会议。

  中国高性能计算机性能TOP100排行榜创始人之一、中科院软件所张云泉博士上会上发布了《2009年中国高性能计算机TOP100排行榜》,由国防科技大学制造的千万亿次超级计算机“天河一号”位居榜首,位于上海超算的曙光5000A位居第二,落户中科院超算中心的联想深腾7000列第三。 

     相关报道:

    “天河一号”千万亿次计算机全方位揭秘

    银河到天河 中国超级计算机发展大事记

    “天河一号”:自主创新的一次成功实践—— 新华社记者对话国防科技大学校长张育林

    超级计算机离老百姓有多远?

    作为此届年会的承办方,国防科技大学还在大会现场展示了其最新的研发成果——“天河一号”千万亿次超级计算机系统,系统峰值性能为1206万亿次每秒,Linpack测试性能超过560.3万亿次每秒,在2009年中国TOP100排行榜中排行第一位。

  该系统将于2009年底至2010年全面部署于国家超级计算天津中心,届时我国将成为继美国之后可以研制和应用千万亿次超级计算机的国家,下表为中国超级计算机发展简历:

型号
面世时间
每秒运算速度(峰值)
银河—Ⅰ
1983年
    1亿次
曙光一号
1992年
    6.4亿次
银河—Ⅱ
1994年
    10亿次
银河—Ⅲ
1997年
    130亿次
神威—Ⅰ
1999年
    3840亿次
深腾1800
2002年
    1万亿次
曙光4000A
2004年
    11万亿次
神威3000A
2007年
    18万亿次
深腾7000
2008年
    106.5万亿次
曙光5000A
2008年
    230万亿次
天河一号
2009年
    1206万亿次

  据介绍,“天河一号”采用多阵列可配置协同并行体系结构,硬件系统由计算阵列、加速阵列、服务阵列以及互连通信子系统、I/O存储子系统和监控诊断子系统等六部分组成,软件系统由操作系统、编译系统、资源管理系统和并行程序开发环境等部分组成。该系统拥有6144颗英特尔CPU和5120颗AMD GPU,内存总容量为98TB,点点通信带宽为40Gbps,共享磁盘总容量达到1PB。相关指标及其意义如下表所示:

参数数字意义
全系统峰值性能系统峰值性能为1206万亿次每秒,Linpack测试性能超过560.3万亿次每秒    “天河一号”计算一天,一台配置Intel双核CPU、主频为2.5GHz的微机得算160年。其性能水平在2009年中国高性能计算机TOP500排行榜中排名第一,参照半年前的世界TOP500排名,可居第四。。
共享存储总容量1PB    按国内数字图书馆应用软件的图片格式PDG计算,如果平均每册书大小约10MB,“天河一号”的存储量相当于4个国家图书馆之和。
重量1.5吨X103    “天河一号”由103台机柜组成,每个机柜占地1.44平方米,高两米,重1.5吨,系统总重量相当于19个“神舟”飞船。
CPU、GPU数量6144个CPU、5120个GPU    每人每个小时写20行代码的速度,需要写1万小时。
互相通信网络单根线传输速率10Gbps    每秒钟要传输800亿比特的信息。这是国际上最快的速率,相当于在“天河一号”计算机内部修了一条信息高速公路。
科技人员平均年龄36岁    直接参与“天河一号”研发的科技人员有200多人。
投资6亿人民币   “天河一号”目前投资为6亿人民币。从信息技术的发展速度预计,使用寿命预计为10年。  
使用寿命10年
每小时耗电量1280度,每年电费可高达1800万元    与目前峰值性能排名世界第一的美国“走鹃”超级计算机相当。“天河一号”目前能效为每瓦4.3亿次运算,与2009年6月公布的全球超级计算机TOP500强排名第一的美国“走鹃”相当。参照2009年6月公布的Green500(全球绿色超级计算机前500强)排名,“天河一号”可以位居第5。 

  对于高性能计算机而言,系统的效能绝不是各单元计算效能的简单叠加。为了实现整体效能的提高,“天河一号”采用了7项关键技术,包括:多阵列可配置协同并行体系结构、高速率扩展互联通信技术、高效异构协同计算技术、基于隔离的安全控制技术、虚拟化的网络计算支撑技术、多层次的大规模系统容错技术和系统能耗综合控制技术。

  1)多阵列可配置协同并行体系结构,融合了计算阵列、加速阵列和服务阵列,在超大规模高性能计算机体系结构方面有所突破。

  2)高速率扩展互联通信技术,取得了40Gbps通信带宽、1.2微秒的延迟的高效通信性能。

  3)高效异构协同计算技术,使用CPU+GPU的体系结构,GPU扮演加速器的作用,它加快了计算机的运行速度,却降低了功耗和成本。

  4)基于隔离的安全控制技术,“天河”实现了不同用户间数据和工作信息的相互隔离。对用户来说,相当于到银行租个保险柜,钥匙掌握自己手里。 

  5)虚拟化的网络计算支撑技术,简化了使用难度,提高了应用开发效率,并可进一步扩展并满足未来云计算的需求。

  6)多层次的大规模系统容错技术,缓解了大规模系统固有可靠性低对用户应用运行的影响,使用户作业成功率得到很大提高。

  7)系统能耗综合控制技术,虽然“天河一号”每年的电费可高达1800万元,但根据6月国际超级计算机能效排名,它依然算得上世界上最环保的5台超级计算机之一。 

  按照工程计划,2010年年底之前,这台由103机柜组成、占地面积近千平方米、总重量155吨的庞大计算机将安装到中国两个国家级超级计算中心之一的天津中心,向国内外用户提供超级计算服务。“天河”将用于石油勘探数据处理、生物医药研究、航空航天装备研制、资源勘探和卫星遥感数据处理、金融工程数据分析、环渤海生态动力和污染数值模拟、基础科学理论计算等方面。

 

 

0
相关文章