万亿次深腾,商用高性能领域的里程碑
【IT168评测中心】如果说1983年亿次银河I型的研制成功表明了我国具有了独立设计和制造巨型机的能力,那么20年后诞生的万亿次联想深腾1800高性能服务器则是高性能计算机从科技成果到商业化道路上的重要里程碑。
2002年8月29日,联想集团宣布万亿次联想深腾1800高性能服务器(DeepComp 1800)正式通过了专家组鉴定并且交付其客户中国科学院数学与系统科学研究院LSSC LSSC-II 项目。研发深腾1800高性能服务器的初衷并非是学术科研需求,而是完全的基于市场需求的企业行为。研发周期相当的短,在当时的高性能服务器事业部总经理祝明发带领的五人项目领导小组和60多名相关技术人员4个月的努力下完成了该系统的设计和部署。
在今天看来,联想深腾1800高性能服务器是一个“庞然大物”,在20个机柜内包含有263个节点、526个Intel Xeon处理器,其内存总容量为272GB,系统总硬盘空间为6TB,系统域网采用了当时已经崭露头角的Myrinet互联技术。
当时专家组鉴定结果为联想深腾1800高性能服务器具有每秒1.027万亿次浮点运算能力,随后2002年11月份公布的世界超级计算机TOP500排行榜中联想深腾1800高性能服务器以1.046万亿次浮点运算能力占据了Top500排行榜第43名的位置。
2002年性能较好的集群7.727万亿次,具有2000亿次浮点计算能力的高性能计算机即可进入TOP500排行榜。截至到2007年6月,8.9万亿次成为了进入TOP500排行榜的门槛,代号“Roadrunner”的IBM 集群式高性能计算机以1.026千亿次的计算能力占据了TOP500排行榜的第一把交椅。可以看到,在过去的几年中,高性能机群的发展非常的迅速,最高性能提升了130倍,主流应用的性能也提供了近50倍!
同样,联想深腾1800高性能服务器在这些年中也有了长足的进步: 2007年威廉姆斯F1车队总部宣布联想经过半年的努力成功的部署了计算能力高达8万亿次的联想深腾1800高性能服务器,该系统用于威廉姆斯F1车队新赛车的模拟风洞空气动力学模型试验、碰撞仿真和CAD/CAM等核心研发工作,为赛车设计提供高效的科学计算依据。
2008年年初联想又宣布2套具有每秒20万亿次超强运算能力的联想深腾1800高性能服务器成功在中国石油集团东方地球物理公司(BGP)部署完成,这将帮助BGP大幅提升能源勘探、数据分析的精度和速度,是联想在商用高性能领域取得的又一重大突破。
从单核到四核,深腾1800快速转化最新英特尔技术
深腾1800高性能服务器是基于英特尔IA架构机群服务器,计算节点做为其计算能力的源泉,紧紧的追随最新的英特尔服务器平台技术。2001年,Intel发布基于Netburst微架构的Xeon处理器之后,联想随即将其应用到了第一台深腾1800高性能服务器的计算节点中,并且部署在了中国科学院数学与系统科学研究院。
英特尔先后几次升级基于Netburst微架构的Xeon处理器的核心,从0.18微米制程的Foster到0.13微米制程的Prestonia,然后是90纳米制程的Nocona和Irwindale。联想都很快的将这些产品陆续应用了到了深腾1800服务器中。
代号Woodcrest的英特尔至强双核处理器
2006年6月份,英特尔发布了基于Core微架构的双核Xeon 5100系列处理器(代号Woodcrest),联想随即将这种高效能的处理器应用到了其高性能机群服务器内,2007年部署完成的威廉姆斯F1车队所采用的联想深腾1800服务器中的160个计算节点中就使用了320颗英特尔双核Xeon 5100处理器。
代号Clovertown的英特尔至强四核处理器
2007年年底,英特尔发布了基于45纳米制程的Xeon 5400系列处理器。联想在2008年3月份宣布2套具有20万亿次超强运算能力的联想深腾1800高性能机群服务器,成功在中国石油集团东方地球物理公司部署。显然其对于英特尔服务器平台技术的消化和转换速度越来越快了。 我们制作了下面的表格,读者可以看到2002-2008期间6台典型机型的状况,从而可以更加直观的了解到深腾1800高性能服务器的发展:
年份 | 英特尔至强处理器 | 系统规模 | 计算节点处理器数量 | 计算节点核心数量 | 浮点计算能力 | 代表应用 |
2002年 | Intel Xeon 2.0GHz(单核,推测为Foster) | 256个 计算节点、4个服务节点、2个I/O节点、1个控制台节点 | 512 | 512 | 1.297万亿次 | 中国科学院数学与系统科学研究院 |
2003年 | Intel Xeon 2.8GHz(单核,推测为Prestonia) | 24个计算节点 | 48 | 48 | 0.1618万亿次 | 华中科大数学系:“生物系统的演化分析”、“复杂流动的格子方法”、“刚性延迟动力系统的仿真技术” |
2005年 | Intel Xeon(单核,推测为Nocona) | 不详 | 不详 | 不详 | 0.7440万亿次 | 西安交通大学理学院高性能实验室 |
2006年 | Intel Xeon(单核,90nm,代号Irwindale) | 不详 | 不详 | 不详 | 1.02万亿次 | 北京化工大学并行计算机系统 |
2007年 | Xeon 5100(双核,65nm,代号Woodcrest) | 160个计算节点,4个管理节点,2个备份节点 | 320 | 640 | 8万亿次(理论),6万亿次Linpack | 威廉姆斯F1车队 新赛车的模拟风洞空气动力学模型试验、碰撞仿真和CAD/CAM |
2008年 | Xeon 5400(四核,45nm,代号Harpertown) | 248个计算节点,8个IO节点 | 496 | 992 | 20万亿次(理论) | 中国石油集团东方地球物理公司 |
从Myrinet到Infiniband,深腾紧随互联域网潮流
在高性能机群服务器系统中,计算节点或处理器之间的互联技术对于整个系统的性能的影响不不亚于处理器。2002年,第一台万亿次深腾1800高性能服务器采用了Myrinet互联域网技术,当时的世界超级计算机TOP500排行榜中有137台使用了这一技术,Myrinet显然是当时最“潮”的互联技术。(当时有34台采用千兆以太网技术,26台采用Quadrics技术)。不过我们也注意到在TOP10中,有5台高性能服务器采用了Quadrics技术,只有1台采用了Myrinet技术。
相对于Myrinet技术,Infiniband算是后起之秀了。2002年的世界超级计算机TOP500排行榜中还看不到Infiniband的身影——2000年9月份才正式发布1.0规范。2003年的世界超级计算机TOP500排行榜中有了Infiniband的三个席位,而且其中一台以10万亿次的性能占据了第三名的位置。Infiniband可谓是来势汹汹。 Infiniband最初设计是类似于现在的PCI-Express技术的一种总线技术,被业界誉为下一代总线标准。但是Intel、Microsoft、IBM、HP先后与2002年间放弃了对于Infiniband的支持,转而另起炉灶PCI-Express,使得Infiniband难以获得之前强大的推力。
2003、2004年左右,Agilent、Motorola也相继放弃Infiniband。最后Infiniband终于找到自己的准确定位:机群互联域网。 从世界超级计算机TOP500排行榜可以看到Infiniband技术绽放了第二春,2006年在排行榜中占据了78个席位,在2007年中占据了122个席位——此时Myrinet已经萎缩到18席。
部署在大庆油田的深腾1800服务器
联想准确的把握了技术潮流,于2004年7月份推出了第一台给予Infiniband域网系统的深腾1800高性能机群服务器,并且成功的部署在了大庆油田。从我们掌握的资料来看,2006年之后的深腾1800高性能机群服务器不再采用Myrinet互联技术,或者采用Infiniband或者是千兆以太网技术。
单一映像的机群操作管理系统
单一系统映象管理是集群系统的关键技术,这种技术可以将系统中所有分布资源组织成一个整体进行统一管理和使用。深腾1800的操作管理系统LCOMS是用B/S架构实现的图形化、单一系统映像的集群操作管理工具,包含集群管理、作业调度、远程控制、信息监视和告警管理5个功能模块,可以统一对深腾1800的硬件、软件、应用进行管理。
机群管理模块
- 对整个机群系统进行单一映象管理
- 向机群系统或选中结点并行发送系统管理命令
- 访问控制、用户管理、NIS配置、时钟同步等
作业调度模块
在机群系统的使用过程中,如何统一管理机群系统中各种软硬件资源?如何方便用户提交和管理作业?如何合理分配资源和调度作业?如何提高整个机群系统的资源利用率和吞吐率?……这是影响机群系统实际使用价值的一系列关键问题。LCOMS中的作业调度模块LJRS有效解决了上述问题:
- 支持多种作业类型,用户能够以批处理和交互式向LJRS提交运行串行和并行作业
- 作业调度策略:FIFO、Reservation和Backfilling等
- 资源管理策略:公平共享、独占以及负载均衡等
- 用户管理策略:使用资源配额、作业提交配额等
- web方式操作:基于web编写作业脚本并提交作业
- 图形化的作业运行状态监控管理
信息监视模块
- 监视硬件健康信息(如CPU个数、主频等、主板风扇转速、主板温度等)
- 操作系统运行信息(如CPU利用率、内存使用情况、进程信息等)
远程控制模块
- 可进行带外远程操作功能,如设备ID灯控制、远程开机、远程关机、远程重启、和SEL清除等
- 可以将本地IDE设备虚拟成远程服务器的IDE设备,并通过IPMIv2.0定义的SOL(Serial over LAN)功能远程接管服务器的开机过程,使用户有机会进行远程的服务器诊断和修复
告警管理模块
- 预设告警阀值,当系统发生告警时,能够及时并以多种方式通知给系统管理员
- 支持丰富的告警信息,如服务器连接状态、硬件健康信息告警、进程CPU利用率超门限告警等
深腾1800再发力
从联想深腾1800第一次登临世界超级计算机TOP500排行榜至今,高性能计算机业界有了长足的发展,比如机群的数量从不足20%,现在已经成为了主流稳稳的占据了80%的席位,而且终于占据了第一的位置。
借助于世界超级计算机TOP500排行榜,联想深腾1800高性能服务器在国际上有过两次非常抢眼的表演。第一次就是2002年凭借万亿次计算机首次亮相在排行榜(第20届,1.046万亿次)中占据了第43位的位置,第二次是在2003年(第21届,1.297万亿次)借助于三台分别应用于中国科学院数学与系统科学研究院、中国科学院大气物理所和大庆油田有限责任公司的深腾1800服务器,在全球TOP500中的排名分别是51位、98位、299位。
年份 | 集群数量 | 深腾1800最高排名 | 计算能力 | 第500名计算能力 | 最高性能集群计算能力 |
2002年11月 | 98 | 43 | 1.046万亿 | 0.195万亿次 | 7.727万亿次(第2名) |
2003年11月 | 210 | 82 | 1.297万亿 | 0.402万亿次 | 13.88万亿次(第2名) |
2004年11月 | 294 | 229 | 1.297万亿 | 0.85万亿次 | 20.53万亿次(第4名) |
2005年11月 | 361 | 无 | 无 | 1.645万亿次 | 38.27万亿次(第5名) |
2006年11月 | 361 | 无 | 无 | 2.736万亿次 | 62.63万亿次(第4名) |
2007年11月 | 406 | 无 | 无 | 5.929万亿次 | 117.9万亿次(第4名) |
2008年6月 | 400 | 无 | 无 | 8.996万亿次 | 1026万亿次(第1名) |
不过,联想深腾1800高性能服务器在取得了1.297万亿次浮点性能之后,并没有进一步的参与世界超级计算机TOP500排行榜,并且在2005年之后淡出了TOP500排行榜。这主要是因为联想在2005年调整发展战略收缩业务战线,将暂时不能带来利润的高性能服务器业务划分为非核心业务。
在这期间,深腾1800服务器虽然不是联想舞台上主角,但是依然在扎扎实实的拓展商务高性能市场。比如西安交通大学理学院高性能实验室采用了计算能力为7440亿次的深腾1800服务器;复旦大学化学系部署了复旦大学的第五套深腾1800服务器系统;北京化工大学并行计算机系统也采用了深腾1800服务器系统。
2007年,联想再次在高性能服务器领域发力并且迅速取得了累累战果。先后在教育、天气预报、石油勘探等领域斩获大单,比如我们前面介绍过的用于威廉姆斯F1车队的8万亿次深腾1800高性能服务器和用于中国石油集团东方地球物理公司的20万亿次深腾1800高性能服务器。 按照最新公布的世界超级计算机TOP500排行榜成绩来看,联想深腾1800是具有进入前200名的潜力的,这一切成绩的取得离不开成功的商业操作和对于技术潮流趋势的准确把握。