服务器 频道

英特尔强势霸占超算 众核开花尚需时日

    【IT168 专稿】随着全球经济的复苏,作为新兴经济体的中国在工业和科技高速发展的过程中,对高性能计算的需求也日益激增。从最新Top500榜单来看,国内两套超级计算机名列前十名,其中“星云”超级计算机性能达到世界第二,均充分证明了国内高性能计算市场的井喷趋势。

    前不久,英特尔高性能计算业务总经理Richard Dracott先生在英特尔中国研究院(融科中心)介绍了未来英特尔高性能计算产品的研发方向,并就英特尔MIC众核计算架构回答了记者提问。

英特尔强势霸占超算 众核开花尚需时日
英特尔高性能计算业务总经理Richard Dracott先生

    英特尔HPC绝对强势 下一代Sandy-Bridge架构浮点性能将提升2倍

    Richard Dracott先生首先与我们分享了一组数据:从5月底发布的全球TOP 500超级计算机排行榜来看,英特尔架构的系统已经达到了406套,占据80%以上的份额。而其中基于至强5500的超级计算机为184套,采用最新至强5600处理器的系统有7套,至强7500的系统2套。中国进入Top500榜单的产品有24套,其中有23套均为英特尔产品——尤其是位居世界第二名的中国“星云”超级计算系统。

    他认为,上述Top500榜单数据充分说明英特尔在高性能计算领域被用户所认可。但同时也表明了超级计算系统的搭建需要一个固定的周期——虽然至强5500早在去年就已经推出,但从去年的Top500榜单来看,并没有太多系统使用该处理器。而今年,使用至强5500的系统为184套。据了解,很多高性能计算机构和超级计算中心都认识到Nehalem架构在高性能计算中的优势,并积极的计划选用该处理器搭建或是升级其超算中心。但从设计到部署、测试需要相当长的一个周期——这毕竟不是买台PC那么简单。

英特尔强势霸占超算 众核开花尚需时日

    因而今年的榜单上出现了大量Nehalem架构的高性能计算机,而另一个原因也在于Nehlaem架构还为超算中心这样的用户带来了巨大的能源节约和成本节约——达到相同性能所需要的能耗更小无疑为超算中心节约了大量电费。

    此外,对于目前越来越多的高性能计算机开始采用异构计算模式——CPU+GPU或者CPU+协处理器等方式,Richard表示从能效比来看,基于Nehalem架构处理器的高性能计算系统效能达到了88%以上,而基于GPGPU的超算系统性能仅仅只有42%,其他专有架构的效能比也仅为78%左右。也就是说,凭借Nehalem架构的强大计算性能,GPU等并行处理器并不占据浮点计算优势——同等功耗情况下其性能并不高,或者说同等性能情况下GPU会带来更多的能耗。

   Richard先生一再强调,英特尔的Nehlaem架构处理器乃至至强5600的Westmere架构处理器并不是为应付诸如Linpack这样的测试工具而优化的处理器(一些专用处理器则会专门为这种典型计算做优化)。因此可以看出,在Top500榜单上,采用了至强5500处理器的超级计算机相比至强5400并没有巨大的性能提升。但是大家都知道Nehalem架构相比上一代在实际应用中2~3倍的巨额性能提升。这不仅得益于架构变迁,还得益于英特尔新加入处理器的指令集和智能计算技术(如Turbo boost、HT超线程等)。

    Richard先生表示,英特尔即将推出的基于32nm工艺的“Sandy-Bridge”架构处理器将集成最新的AVX指令集,从而可以带来巨大的浮点计算性能提升——预计会超过六核至强5600两倍以上。

英特尔强势霸占超算 众核开花尚需时日

    MIC众核计算架构的基础是市场需求

    在接下来的演讲中,Richard先生还介绍了英特尔前不久提出的MIC众核计算架构。他表示,相比Nvidia和ATI的GPGPU,英特尔仅供开发人员的Knights Ferry在单精度浮点运算方面的性能超过500GFlops——而目前的GPGPU的最好成绩是380GFlops。

 试金智能计算 全面解读英特尔未来路线

    据介绍,未来22nm商用化的Knights Corner众核架构处理器将主要被定义为协处理器,并不会取代现有的x86处理器体系,目前提供给开发者的Knights Ferry集成了32个核心,主频1.2GHz,每核心支持4线程,总计128线程,并有8MB共享一致性缓存,同时搭载1-2GB GDDR5显存,绑定Intel HPC工具。

Larrabee衍生品 Intel将推22nm众核芯片

    Richard先生认为,过去30年中不论是教育行业还是科研领域,在处理器中的加速器(或者叫协处理器-Co-processor)才获得了成功。客户并不只需要协处理器或GPGPU,而更需要一个容易编程和维护的环境——这是目前GPGPU的重大缺陷。

    他表示,虽然目前提供给开发人员的MIC架构处理器是以PCI-E计算卡的形式实现。但未来英特尔也可以选择在CPU中集成MIC众核架构——一切按市场需求来设计。此外,Sandy-Bridge架构中将首次集成PCI-E总线控制器,进一步“消灭”北桥,从而让CPU可以直接与MIC计算卡通讯,消除高性能计算时的I/O瓶颈。

    不过,Richard先生也始强调,目前大家看到的都还是实验室产品和数据,与真实商业应用的版本肯定会有区别。他表示,英特尔会与合作伙伴共同对Knights系列架构做测试和开发,以期更好的发挥其性能,挖掘更多应用。

0
相关文章