服务器 频道

张振宇:融核协处理器开辟百亿亿次道路

  【IT168 专稿】随着英特尔历时8年研发的至强融核协处理器在盐湖城全球超级计算大会上正式亮相,11月14日,英特尔在中国也同期举办了媒体发布会,介绍了MIC融合协处理器的产品系列、具体型号以及出货价格。

  至强融合协处理器的两个系列

  本次发布的至强融合协处理器包括两个系列,分别为至强融核协处理器3100产品家族和至强融核5110P。这两款产品都基于英特尔最新22纳米3-D三栅极晶体管制程工艺,其中5110P其实在今年早先时间已经部分发货,并出现在了最新发布的第40届全球高性能计算机500强(TOP500)排行榜的上榜系统中,其正式面市时间将在明年1月28日,售价约在2650美元;3100产品家族则预计将于2013年上半年正式发布,定价将低于2000美金。

至强融合协处理器的两个系列
▲全新发布的至强融核协处理器

  据介绍,英特尔至强融核3100产品家族可提供峰值超1000 Gigaflops(即每秒1万亿次浮点计算)的双精度浮点计算性能,提供6GB GDDR5内存,内存带宽最高达240GB/秒,同时提供内存错误校正码(ECC)等一系列可靠性特性,工作时的热设计功耗(TDP)范围在300瓦以内,支持C、C++、Fortran等工具语言,主要面向包括MonteCarlo、Black –Scholes、HPL、生命科学等应用对象。

  英特尔至强融核协处理器5110则能以更低的功耗提供额外的性能,达到1,011 Gigaflops(即每秒1.01万亿次浮点计算)的双精度浮点计算性能,支持容量和带宽分别高达8GB和320GB/秒的GDDR5内存。热设计功耗(TDP)为225瓦、可进行被动散热的英特尔至强融核协处理器5110P具备适用于密集计算环境的能效表现,可用于处理诸如数字内容创建和能源研究等内存密集型工作负载。

  能耗方面,Xeon-phi协处理器同样集成了node manager管理工具,有助于降低能耗,同时MIC卡上有主动能耗管理单元,在MIC闲置的时候会降能耗,类似于之前的睿频技术。此外英特尔强调:至强融核处理器可以利用现有为英特尔架构提供的软件编程环境、工具、副函数,以及帮助客户调优,这样大大减少应用移植和开发的时间成本和人力成本,为ISV、软件开发商和用户提供应用代码的共享,节省了大量的人力和物力成本。

至强融合协处理器的两个系列
▲英特尔(中国)有限公司服务器平台产品经理张振宇

  “几年前开始通过加速器提升高性能计算的理论峰值开始,客户就一直面临着一个困惑,就是如何将客户的实际应用有效地移植到混合架构上。因为加速器应用的是特定的应用编码,往往会因为这种异构编码而产生的额外的时间、人力成本,甚至更多的不利因素。”英特尔(中国)有限公司服务器平台产品经理张振宇在发布会现场表示。

  “至强融核协处理器则与加速器不同,他与至强使用相同的编程语言、相同的指令、相同的副函数以及相同的工具,会为客户带来非常好的生产力。一个单一的代码,经过简单编译就可以在至强以及Xeon Phi上同时运行。很多客户认为这是一个福音,帮助他们减少了大量应用、移植以及开发的时间。”

  据张振宇介绍,Xeon Phi一经推出就得到了众多应用开发的生态系统的广泛支持,包括开源和商用的应用工具,编译器、Runtime还有一些Debug工具,还有一些副函数以及分析工具、性能调优工具,以及作业调度器等等。

${PageNumber}

  实现高度并行计算的主要动力

  据英特尔的预测,在未来五年内,数据中心市场出货量和业绩都会有翻番的表现,其中云计算、高性能计算和网络是主要推动力,而高性能计算每年将保持约20%的增长率,推动数据中心并行化进程。

  在刚刚发布的全球高性能计算Top500排行榜上,新上榜系统中有91%是基于英特尔处理器构建,英特尔至强融核协处理器也被其中的7套上榜系统所采用,包括该榜单上能效最高的Beacon系统(其能效为每瓦2.44 GFlops,GFlops为每秒十亿次浮点计算)。

实现高度并行计算的主要动力
▲德克萨斯高级计算中心(TACC),该数据中心使用全新的英特尔至强融核协处理器技术

  英特尔认为:Xeon E5家族处理器可以看作是实现高性能计算的主要动力,英特尔Xeon phi可以看作是E5产品家族的有效补充。目前通过E5和至强协处理器的搭配可以看到众多并行的应用包括气候模式的建模、基因研究、油藏模拟分析等等,众多的科学研究和技术问题。英特尔相信这两款产品相互配合,能够开辟出一条百亿亿次的道路。

  而在Xeon E5与Xeon phi的定位区别上,张振宇解释:英特尔至强产品是为主流的企业应用、关键业务包括技术计算提供强大的处理能力。英特尔至强融核品牌是针对高度并行应用进行优化的产品,是至强品牌的有效补充。根据英特尔针对Xeon E5处理器以及Xeon Phi在不同环境、不同计算模式的比较数据,对于一般的并行化计算,显然Xeon E5处理器就完全可以胜任,加速器和Xeon Phi在通用计算上并不占明显优势,只有在高度并行的计算环境下,加速器和Xeon Phi协处理器在功耗、空间占有、成本上都能体现显著的优势。

  此外,张振宇还透露,目前Xeon phi暂时作为协处理器与CPU协同作业,但实际上,Xeon phi拥有独立内核,完全支持native独立运行模式。

  现场英特尔还展示了诸多应用Xeon phi协处理器的国内的实验案例,例如中国石化石油物探技术研究院就将其能源行业叠前深度偏移应用(PSDM)移植到了至强融核协处理器环境。中国石化石油物探技术研究院副院长兼总工程师赵改善表示:“我们的叠前深度偏移应用在英特尔至强融核协处理器上性能提升2.53倍,我们深受鼓舞,我们用的编程方法、MKL库、DFT程序和源代码与在英特尔至强处理器上应用的都完全相同。同时,我们用2个计算节点实现了10倍的性能提升,进一步展示了其优良的扩展性能,英特尔至强融核协处理器将大大提升中石化的iCluster地震资料成像系统的处理能力。”

0
相关文章