服务器 频道

CPU性能不够快 英特尔48核芯片再提速

  【IT168 专稿】有人说,现在的处理器芯片速度发展实在太快了,四核、六核已经是主流,八核、十二核也即将面世,CPU的发展已经快得让内存、存储、I/O都跟不上了,多核计算带来的软件并行化也是个问题。而英特尔在TICK-TOCK策略下,仍然坚持每隔一年就对处理器微架构和制造工艺进行更新。不过,在英特尔看来,处理器发展的仍然不够快!

  48核"单芯片云计算机",功耗低至25瓦

  12月3日,英特尔展出了一款集成了48核心的研究型芯片,旨在提高未来几十年的片上性能、芯片通信方式并降低能耗,让未来智能化处理器可以驱动计算机利用“视觉”实现人机互动。这是继2006年的80核心芯片原型之后,英特尔在万亿级计算研究上的最新成果。虽然核心数不增反减,但其所使用的技术却更加成熟,具体区别如下表所示。而且,英特尔这次将这款芯片非常应景地命名为“单芯片云计算机”(SCC),即该芯片原型采用了一种用于在互联网上建立“云”计算资源的数据中心的结构形式。

2006年众核芯片:
万亿次浮点运算研究处理器
2009年众核芯片:
单芯片云计算机
众多简单的浮点内核,功能和可编程性有限
众多全功能的IA内核,可以做更多应用
验证瓷砖片设计理念
仍然采用被证明成功的瓷砖片设计,可以节省大量设计与验证时间及成本,可以根据不同应用负载进行瓷砖片的混合搭配设计。
测试网格状网络的硬件极限,如路由的最大性能
更加强调能效,网格的功耗性能比提高了3
内核及电路级休眠功能,但功能比较简单
动态电压及频率扩展,功耗控制精度更高,且更灵活,并提供了接口,让软件厂商可以更好地利用电源管理功能
一般负荷的消息传递,是简单、简短的消息传递
消息传递及控制内存共享,可以传递更长的消息,且实现了核与核之间的内存共享
满足基本标准的有限可编程能力
适用应用程序研究的全面可编程能力
主要是电路实验
电路与软件研究的平台
200912月,IT168服务器频道

  一般而言,云数据中心往往需要数十乃至数千个计算机通过有线网络互连而成,并行执行大量任务,处理海量数据。而这款所谓的“单芯片云计算机”,用类似的方法,将所有的计算机和网络都集成在了一个只有邮票大小的单个芯片上。这样做的好处是能耗更低,可靠性更高,密度更高,效率更高,而且有更好的可编程性。

 

英特尔芯片原型拥有48个IA内核,功耗低至25瓦

  英特尔研究院院士、万亿级计算研究总监詹姆斯•郝尔德今日在北京向媒体介绍了这款“众核”芯片。他谈到,单核时代,处理器主要是用来处理文本信息,以及拓展多个应用领域,并不断提高计算效率;随着应用的发展,互联网时代人们需要的是计算的可视化,实现移动计算,体验视频、音频等多媒体带来的娱乐内容,于是多核处理器得以出现;而在即将到来的众核时代,我们要面对的是“沉浸式、个性化、互动、智能”的应用,如虚拟现实、3D互联网、计算机用“视觉”识别运动物体、用脑电波控制计算机等等,而现在的处理器性能并不够用。“单芯片云计算机”正是英特尔研究院在这一未来主流芯片领域的最新研究成果。

英特尔研究院院士、万亿级计算研究总监詹姆斯_郝尔德演讲

  从能耗到软件编程 众核计算面临的挑战

  当然,众核处理器面临的技术难题也是非常有挑战性的,主要集中在能效、设计复杂性、编程模式、并行软件、新兴应用开发等方面。据介绍,这款采用45纳米工艺及Hi-K金属门硅制造技术的实验性众核CPU,拥有48个IA内核,双核节点网络在芯片级别模仿去计算,通过细粒化电源管理,可将功耗控制在25瓦特-125瓦特之间,这与现在的英特尔处理器的能耗水平接近,仅相当于两个普通家用灯泡的耗电量,支持成熟的、高度并行的“可扩展”编程模型。

  其中最有挑战性的可能是软件编程。据现场的英特尔中国研究院研究员介绍,对于现有的单核、双核、四核、八核处理器,一般采用的是共享内存的编程模式,需要支持缓存的一致性,而在云计算环境中,集群系统一般使用消息传递的方式。而这款“单芯片云计算机”正是在硬件芯片层面实现了对消息传递的支持和优化,而对于共享内存的编程则改用软件来实现。由于消除了硬件缓存一致性,可以大大降低复杂性和能耗。而且,经过证明,类似集群、云计算的消息传递方式可扩展到具有1000个内核的处理器上。

  英特尔现场演示了这款芯片灵活调用、分配不同数量核心来完成股票期权价格预测的计算情况,表明,随着计算核心的不断增加,其加速比基本呈现线性增长。

英特尔中国研究院研究员进行技术展示

  詹姆斯•郝尔德也谈到了SCC与市场上其他众核产品的不同,主要有两个区别,一是SCC仍然是实验型的芯片,目的是供软件开发商在开发软件时进行研究,而不是对外销售的产品;二是跟其他众核产品不同,SCC使用的是原有的IA架构核心,因此可以让软件开发商利用现有的编程工程、函数库来编程,兼容性更好。跟即将于2010年投产的英特尔GPU产品Larrabee也不同,Larrabee针对的是图形处理器,强调浮点计算、矢量计算,而SCC针对的是数据中心、云计算环境应用,而且仍在研究当中。

  英特尔计划提供100个或更多的研究芯片,供全球数十家行业及学术研究合作伙伴研究使用,为未来的众核处理器开发新的软件程序和编程模式。目前,包括微软、加州大学伯克利分校、伊利诺伊大学、惠普和雅虎的研究人员都已经在不同应用领域进行了面向众核芯片的编程尝试。关于该芯片架构和电路详细情况的论文预计将在2010年2月举办的国际固态电路大会(International Solid State Circuits Conference,ISCC)上公布。

0
相关文章