【IT168 专稿】2012年9月21日,浪潮高性能计算用户大会在泉城济南举行。本次大会以“根植应用 引领创新”为主题,来自国家863专家、国家超级计算济南中心、国家超级计算天津中心、中国科学院、上海交通大学、中国海洋大学、浪潮集团、英特尔、迈络思等业内顶尖专家和中国各行业高性能计算用户代表,就中国高性能计算的应用创新与技术发展、软件开发和算法优化、系统运维管理等议题展开了深入探讨,并共同探索中国高性能计算的技术创新与应用发展方向。
全面迈向百亿亿次计算
提到超级计算机,我们首先联想到的是其无以伦比的计算能力,国际上的TOP500排名榜单也是以Linkpack浮点计算能力来排位的,IBM Sequoia(红杉)超级计算机以16.32PFLOPS的浮点峰值计算能力,打破日本K Computer的10.51PFLOPS的前世界靠前记录。
▲国家863专家、国家超级计算济南中心、国家超级计算天津中心、中国科学院、上海交通大学、中国海洋大学、浪潮集团、英特尔、迈络思等业内顶尖专家和中国各行业高性能计算用户参与本次大会
经历了半个多世纪的发展,如今计算机的计算能力已经到了10PFLOPS的级别,全球Top500前十套超算系统全部达到千万亿次级别,而中国超算Top100前六套系统均超过了千万亿次,当前,超算整体正在向百亿亿次计算的台阶迈进。
▲北京航空航天大学教授、国家863计划高性能计算机及其核心软件重大专项总体组组长钱德沛致开场词
百亿亿次同样也成为本届高性能计算大会的关键词,北京航空航天大学教授、国家863计划高性能计算机及其核心软件重大专项总体组组长钱德沛在本届高性能计算用户大会上指出:从当前的技术实现上看,要实现百亿亿次计算机还面临四大挑战,分别是功耗问题、性能问题、可编程性、可靠性或者是可恢复性。
浪潮集团高性能服务器产品部总经理刘军也谈到:百亿亿次是中国以及全球超算领域的重要发展方向。百亿亿次并不是千万亿次×1000的简单乘法,而是面临着系统架构、异构加速、并行算法、软件生产力、功耗与管理等各方面的的巨大挑战。“我们知道,在2010年,中国超算系统达到千万亿次计算规模,所以我们的目标,是要在八到十年时间内,实现一千倍的跨越。”
刘军介绍,浪潮正在积极参与百亿亿次相关的研究准备工作,包括在系统架构、应用创新、系统管理、以及新的技术方向研究方面,浪潮都在进行着积极的准备。尤其在应对百亿亿次计算所带来的功耗、应用、软件等方面的巨大挑战。“十二五期间,国家也规划了在2015年之前实现100个P性能的超级计算机,100个P的概念相当于百亿次的十分之一,在这个方面,浪潮也正在积极发挥自己的作用。”
${PageNumber}X86生态圈是MIC技术最大优势
在超级计算从千万亿次迈向百亿亿次时代之际,超级计算机产业正迎来新一轮的技术变革,Intel MIC融核技术便是其中之一。本次高性能计算用户大会上,英特尔首次在国内揭开Intel MIC融核技术详细开发过程,并与大家分享了Intel MIC融核技术的应用案例。
MIC是英特尔公司开发出的最新并行处理架构,主要针对高性能计算、工作站和数据中心高度并行处理的应用领域,推动百亿亿次超算计算技术革新。相比传统处理器,英特尔MIC具有更小的内核和硬件线程,以及更宽的矢量单元,能更有效率的提升整体性能、满足高度并行化的高性能计算应用。此外,MIC还具有更强的兼容性,能够通过使用标准的C、C++和FROTRAN源代码进行编程。
▲英特尔亚太和中国区数据中心及互联系统产品部高性能计算系统架构师何万青博士
英特尔亚太和中国区数据中心及互联系统产品部高性能计算系统架构师何万青博士在大会间歇专访时告诉媒体记者:“X86生态系统是英特尔MIC技术的最大优势。”
何万青博士谈到,英特尔历来的强项在于制造工艺,尤其是纳米制程方面取得了突出的成绩。在制造良品率和成本等方面有较好的控制,尤其在大规模生产处理器的市场背景下更拥有规模化成本优势。
此外何万青还表示,由于MIC是使用与Intel至强处理器相同的工具、编译器和库的全新架构,而全球超过80%的超级计算机采用了英特尔公司的处理器平台,因此,研发人员在开发针对MIC平台的软件的时候,能够继续在一个较为熟悉的领域开展研发工作,较好解决了重新编程等技术问题。
“现有的英特尔开发工具,编译器,都可以支持MIC。在有MIC协处理器存在的时候,就可以直接编译MIC代码,这样大家在应用MIC的时候,使用的所有工具和以前完全一样。”
“GPU产品的上市时间要早于MIC技术,但实际上,MIC很早就开始了研发的进程。在分析计算模式的时候,我们认识到,作为一个加速器的计算模式,GPU的模式是offload的模式,英特尔Mic作为协处理器支持模式非常多,实际上就是作为单独的计算节点,有自己的操作系统,不仅仅支持Offload,同时也努力做到和X86兼容,支持更多的系统。”
▲英特尔全球高性能计算销售总监Mark Spargo在主会场演讲中就MIC技术进行了深入介绍
浪潮作为中国领先的高性能计算厂商,早在 2011年8月就与Intel公司联合成立中国并行计算联合实验室,共同进行“百亿亿次”创新研发工作,推动中国百亿亿次超算研究,突破包括新型体系架构、应用软件并行算法设计及编程模型及工具链等在内的各项技术,同时实验室作为开放的交流平台,与众多典型应用的HPC用户、研究机构一起,建立高性能计算产业新的技术生态环境,共同推动中国HPC领先进入百亿亿次时代。
浪潮-英特尔中国并行计算联合实验室建立之初,就与石油、气象、金融、生命科学等行业客户选取了明确的应用课题,如石油天然气勘探应用领域、数字气象预报领域、生命科学领域、金融行业等应用研究等。该实验室在基于MIC应用技术基础上,通过移植和算法优化,在典型行业应用研究上均得到了量级的性能大幅提升。目前联合实验室基于MIC的开发测试平台已在多个行业进行移植开发,为即将发布的MIC正式产品做前瞻性研究。
${PageNumber}神威蓝光:定制化系统重在应用移植
此外,本次大会组织参会者共同参观国家超级计算济南中心,其中,我国首台全部采用国产中央处理器(CPU)和系统软件构件的千万亿次计算系统神威蓝光就坐落在济南超算中心。实际上,本次用户大会关注的焦点在于应用,现场,超级计算济南中心主任助理潘景山就神威蓝光的应用状况进行了介绍和讲解。
神威蓝光是国家科技部863计划支持,由国家并行计算机工程技术研究中心制造,于2011年9月安装于国家超算济南中心,全部采用自主设计生产的CPU(ShenWei processor SW1600),系统共8704个CPU,峰值1.07016PFlops,持续性能795.9TFlops, Linpack效率74.37%,总功耗1074KW。国家超级计算济南中心是科技部批准成立的全国3个千万亿次超级计算中心之一,由山东省科学院计算中心负责建设、管理和运营。目前已试运行近一年时间,共移植优化60多道重点应用课题,系统利用率超过60%。
该系统拥有四大特点:一是全部采用国产的CPU;二是Linpack效率高达74.4%,而一般的千万亿次机都在50%左右;三是采用液冷技术,节能;四是高密度,在一个机仓(机柜)里可以装入1024颗CPU,千万亿次规模仅需要9个这样的机仓。
潘景山介绍,神威蓝光从去年10月份正式投入运营后,系统平均利用率基本维持在60%左右的状态,峰值时期则利用率高达72%、75%左右。所针对的应用都是千核以上的计算应用,例如气候气象方面的应用,需要利用到万核以上资源,一些流体仿真的应用则跑到了三万核,部分生物制药应用达到了9万核的应用规模。
“山东是海洋大省,我们在海洋领域的计算模拟也是重点支持,现在我们50%的资源都在海洋领域,现在我们和合作单位一起可以做到十分之一,二十分之一度的全球高空变率的一个海洋环流的一个模拟计算。”潘景山详细解释道。
此外,潘景山也坦言在海洋应用软件方面国产软件的自主率还处于比较低的水平。“我们只能用国外的软件进行优化来提高效率,我们也可以根据不同的软件需求,进行资源的动态分配,目前国内的应用软件暂时性差距还比较大。”
但潘景山认为,实际上神威蓝光全国产CPU系统的应用,对国产软件开发的促进作用非常明显。“假设如果全部采用主流的处理器,例如英特尔加上GPU或者加上MIC这些主流芯片,那么基本上不需要任何移植工作,直接运行就可以了。就是因为我们采用了自主的制定机,所有的软件我们需要进行移植,就有利地促进了国家自主应用软件的开发,和国外应用软件的应用移植,使得整个生产系统得到良性的发展。”