服务器 频道

六核直联 AMD伊斯坦布尔处理器实物解析

  【IT168评测中心】在年中的时候(2009年6月1日,美国当地时间),AMD发布了其Shanghai/上海更新换代的产品:Istanbul/伊斯坦布尔,将核心数量从上海的四个全面升级到六个。到现在为止,Istanbul/伊斯坦布尔仍然是唯一的一个直联架构六核心服务器处理器。 


AMD 六核心Istanbul/伊斯坦布尔处理器,可以用于最高八路处理器架构

  实话说,虽然在国外Istanbul的现身很早,不过在国内仍然是非常迟的:直到现在才有正式的产品发布。10月底,我们拿到了DAWNING曙光推出的AMD六核心Istanbul服务器,型号为A840r-H。而在5月份的时候,我们就测试了同样是曙光推出的Intel六核心Dunnington服务器,型号为I840r-H,从型号上可见这两台机器有相当多的共同之处:它们都是四路八核心的服务器。


采用了六核心Istanbul/伊斯坦布尔处理器的曙光A840r-H

  而在桌面领域,Nehalem架构的六核心处理器Gulftown也已经现身,不过,我们仍然要说,Istanbul/伊斯坦布尔仍然具有它的特色:唯一的直联架构六核心多路服务器处理器。Intel的Dunnington是四路六核心服务器处理器,而且其基于教老的Penryn架构,仍然是三个双核处理器粘合而来,而Gulftown毕竟是桌面处理器。Intel真正6核心服务器处理器是Westmere-EP,不过是双路平台,八路八核心的Nehalem-EX才是Istanbul对应的产品,然而要留待明年初才会有实物推出。


AMD 45nm Shanghai/上海 Opteron 2378,和Istanbul共享一个基础架构 


Istanbul/伊斯坦布尔实物:AMD Opteron 8431处理器,频率2.4GHz,内置六个物理处理核心

  Istanbul/伊斯坦布尔继承了AMD处理器采用F1方程式赛车赛道命名的传统,它仍然采用了45nm SOI制程工艺,并且基于Shanghai核心。和上一代的Shanghai相比,Istanbul最大的变化就是核心数量的提升,并继续提高了Shanghai处理器上出现的HT3.0总线的速度(当然现在的Shanghai处理器未能实现HT3.0——因为芯片组的缘故)。  

Istanbul:原定路线图

   虽然核心架构变化不大,不过核心数量有了50%的增长,Istanbul的性能提升将会比较明显,繁琐的测试正在进行中,现在我们先来体验下这款最新的六核心处理器的各种细节。

 全国首发 AMD Shanghai/上海性能评测

曙光I840四路六核Dunnington服务器评测


直联架构:Istanbul与Nehalem-EP

  作为Shanghai的升级产品,Istanbul在架构/微架构方面都和上一代比较相似。


AMD Istanbul/伊斯坦布尔架构图


AMD Shanghai/上海架构图

 
AMD Barcelona/巴塞罗那架构图

  就图上看,很明显的一个提升是HT总线的速率:Shanghai是24GB/s,Istanbul是57.6GB/s,不过真实的情况是:Shanghai标的速率是基于HT 1.0,Istanbul是HT 3.0。Shanghai也能提供HT 3.0总线的支持,不过由于芯片组的缘故,只能使用HT 1.0。本来AMD打算Istanbul发布的时候同时推出新的芯片组,不过现在来看,提前发布的它也只能使用HT 1.0了。我们收到的A840r-H确实使用了NVIDIA的nForce 3600芯片组,而不是原定配合的AMD Fiorano芯片组。


Istanbul:原定路线图

Istanbul HT总线的速度是这样子的:频率为2.4GHz(Shanghai为2.0GHz,在HT 1.0的时候频率为1.0GHz),基于DDR(双倍数据速率)的情况下就是4.8GT/s(giga transfer per second),而HT总线位宽是16位,因此就是9.6GB/s;考虑到双向传输的话,Istanbul每条HT 3.0能提供19.2GB/s的带宽,三条总线就是57.6GB/s的最高双向传输总带宽。作为对比,Intel Nehalem-EP带有两条QPI总线,频率为3.2GHz,6.4GT/s,12.8GB/s单向、25.6GB/s双向,51.2GB/s总双向带宽,单条QPI总线比HTT要大一些,不过总的传输带宽低一点:Nehalem-EP面向的是双路平台;四路平台的Nehalem-EX具有四条QPI总线,从外部总线上,倒是Intel要胜上一筹。


AMD六核心Istanbul伊斯坦布尔架构猜想图


AMD Shanghai/上海架构

 缓存的变化:


Shanghai Opteron 2378缓存架构

 


Istanbul Opteron 8431缓存架构

  值得一提的是Istanbul的缓存方面的变化,这个变化是在容量上。在架构上,Istanbul仍然是三层缓存,前面两层是独享,最后一层在所有核心中共享。

  容量上,Istanbul显得比较反常,因为四核心的Shanghai是6MB L3,Istanbul只有5MB,这样分到每个核心上就不足1MB了,其他层的缓存容量和Shanghai一致。为什么会具有更少的缓存呢?或许是为了降低一点缓存同步的压力。

 

 


AMD 六核心Istanbul/伊斯坦布尔处理器
 

AMD 六核心Istanbul/伊斯坦布尔处理器
 

AMD 六核心Istanbul/伊斯坦布尔处理器

AMD 六核心Istanbul/伊斯坦布尔处理器


AMD Shanghai/上海晶圆超级大图(2560x1742),包括了4个完整的四核上海CPU

 


Opteron 8431与Athlong II x4


AMD 六核心Istanbul/伊斯坦布尔处理器

  AMD 45nm Istanbul/伊斯坦布尔将会首先由GlobalFoundries公司生产,我们现在已经知道GlobalFoundries是AMD拆分出去的生产工厂成立的独立公司。拆分之后,AMD成为了一个Fabless的处理器设计公司。这个拆分应该有资产方面的因素,此外也有拓展生产工厂业务的考虑。现在GlobalFoundries的主顾除了AMD之外还有其他公司。


Computex 2009: GlobalFoundries展示的28nm SRAM Bulk, 32nm Test Chip SOI, 45nm Istanbul SOI

  在之前举行的台湾Computex 2009上,GlobalFoundries展示了45nm Istanbul晶圆(同时也展出了多种可以向AMD之外的客户提供的其它工艺)。IT168也派出了报道团参加:

台北电脑展盛大开幕 IT168派记者团赴台现场报 


GlobalFoundries 45nm Istanbul SOI Wafer
 

GlobalFoundries 45nm Istanbul SOI Wafer,你可以数一数每个CPU上面的核心数量

Diffused in Germany, Made in Malaysia
德国生产,马来西亚组装

  Istanbul晶圆由德国的Dresden德累斯顿的Fab 1 Module 1生产。

 


据称在相同的功耗下提升了30%的性能,至于“完美的执行”看一下就算了
 

  除了6个核心、双通道DDR2-800集成内存控制器和最多三条HT 3.0总线之外,Istanbul还提供了进化版的AMD-V 2.0,让“伊斯坦布尔”的虚拟化性能再度提升,并加入了新的AMD-P技术来更完美地控制处理器功耗,配合CoolCore和Smart Fetch技术可以限制内核功耗甚至关闭内核。

HT Assist:降低维持缓存一致性所需要的步骤,图上是从10个事务降低到只需要2个事务

HyperTransport  technology Assist (HT Assist):降低多个处理器之间的缓存探测,降低交通量,从而提升4路/8路服务器的性能,优化如数据库、虚拟化这样的缓存敏感应用以及计算密集型的应用。

缓存探测是什么?为了维护内容的一致性,在多个处理器共享的缓存内存必须要保持一致——也就是维持缓存一致性。在其中的一份页面被修改的时候,其他处理器通过“缓存探测”来检测到这个操作,从而进行维持一致性的举动。这个举动在不同的系统上可以不同,既可以是更新复制被修改过的的页面,也可以是使其他的副本无效。实际上,这个HT Assist和Intel 5000X芯片组上的Snoop Filter缓存功能是差不多的,只是它占用的是L3缓存,也因此在双路配置的时候,必须把HT Assist功能——通常BIOS里面叫做Probe Filter的选项关闭。

需要澄清的一点是,一些说法是使用HT Assist后四路系统内存带宽可以提升60%。不对,不是这样,只是在一些应用中具有这么高的提升,如图上所示的“STREAM Memory bandwidth,流操作内存带宽”。

Extended Migration扩展迁移:兼容所有的单核/双核/四核/六核处理器,允许虚拟机在不同系统之间进行自由迁移。


Intel VT-d:不是我不想用AMD的图,而是实在资料太少

AMD-Vi:I/O级别的虚拟化,允许多个虚拟机分别直接与I/O设备沟通(需要Fiorano平台:SR5690/SR5670芯片组),提供更好的设备隔离安全性和虚拟I/O性能。与Intel的VT-d有些类似,可以看这里:

从VT-x到VT-d Intel虚拟化技术发展蓝图

功耗:在功耗上,Istanbul/伊斯坦布尔虽然多了50%的核心,然而通过工艺上的进步,以及电源管理技术上的改进,最后仍然维持了和Shanghai处理器一致的ACP平均功耗,当然,对于这点,我们期望后面的测试可以给出准确的数值。

远程电源管理界面APML:提供一个远程监视、控制平台功耗的界面,无需进入BIOS调整。对于大规模数据中心来说,逐台服务器进入BIOS调整电源管理参数是很麻烦的,APML就是个很方便的解决方法。

服务器系统需要一颗处理器和BMC(管理处理器)来支持APML,并需要相关管理软件,我们也随A840r-H机器收到了曙光研发的电源管理软件。

 

AMD Istanbul/伊斯坦布尔规格表

名称

Opteron 2427Opteron 2431Opteron 2435Opteron 2439 SE Opteron 8431Opteron 8435Opteron 8439 SE
系列

双路

八路

主频

2.2GHz

2.4GHz

2.6GHz

2.8GHz

2.4GHz

2.6GHz

2.8GHz

HT频率

2.4GHz

HT速率

9.8GB/s(单向)
19.6GB/s(双向)

核心/线程

6/6

L2缓存

6x 512KB

L3缓存

5MB

ACP75W

  首先推出的Istanbul属两个系列:双路,以及八路(当然它们也能用于四路),型号分别是2427、2431、2435、2439 SE以及8431、8435、8439 SE,第一位数字表明面向多少路系统,第二位数字表明采用的插槽,虽然同样是Socket F 1207,不过规格和上一代23xx/83xx不同(如,支持DDR2 800等),最后两位数字代表着性能,更大的数字表示性能更强。额外的SE后缀是后来又推出的新版本,频率达到了2.8GHz。

 
Istanbul/伊斯坦布尔:AMD Opteron 8431处理器,频率2.4GHz,内置六个物理处理核心

  我们手上的A840r-H服务器使用的是8431。


早期的规格表上并没有2439 SE和8439 SE

 

CPU资料

缓存架构

曙光的主板,基于NVIDIA nForce Pro 3600芯片组

CPU:24个核心

任务管理器里的24个物理核心

  【IT168评测中心】在年中的时候(2009年6月1日,美国当地时间),AMD发布了其Shanghai/上海更新换代的产品:Istanbul/伊斯坦布尔,将核心数量从上海的四个全面升级到六个。到现在为止,Istanbul/伊斯坦布尔仍然是唯一的一个直联架构六核心服务器处理器。 


AMD 六核心Istanbul/伊斯坦布尔处理器,可以用于最高八路处理器架构

  实话说,虽然在国外Istanbul的现身很早,不过在国内仍然是非常迟的:直到现在才有正式的产品发布。10月底,我们拿到了DAWNING曙光推出的AMD六核心Istanbul服务器,型号为A840r-H。而在5月份的时候,我们就测试了同样是曙光推出的Intel六核心Dunnington服务器,型号为I840r-H,从型号上可见这两台机器有相当多的共同之处:它们都是四路八核心的服务器。


采用了六核心Istanbul/伊斯坦布尔处理器的曙光A840r-H

  而在桌面领域,Nehalem架构的六核心处理器Gulftown也已经现身,不过,我们仍然要说,Istanbul/伊斯坦布尔仍然具有它的特色:唯一的直联架构六核心多路服务器处理器。Intel的Dunnington是四路六核心服务器处理器,而且其基于教老的Penryn架构,仍然是三个双核处理器粘合而来,而Gulftown毕竟是桌面处理器。Intel真正6核心服务器处理器是Westmere-EP,不过是双路平台,八路八核心的Nehalem-EX才是Istanbul对应的产品,然而要留待明年初才会有实物推出。


AMD 45nm Shanghai/上海 Opteron 2378,和Istanbul共享一个基础架构 


Istanbul/伊斯坦布尔实物:AMD Opteron 8431处理器,频率2.4GHz,内置六个物理处理核心

  Istanbul/伊斯坦布尔继承了AMD处理器采用F1方程式赛车赛道命名的传统,它仍然采用了45nm SOI制程工艺,并且基于Shanghai核心。和上一代的Shanghai相比,Istanbul最大的变化就是核心数量的提升,并继续提高了Shanghai处理器上出现的HT3.0总线的速度(当然现在的Shanghai处理器未能实现HT3.0——因为芯片组的缘故)。  

Istanbul:原定路线图

   虽然核心架构变化不大,不过核心数量有了50%的增长,Istanbul的性能提升将会比较明显,繁琐的测试正在进行中,现在我们先来体验下这款最新的六核心处理器的各种细节。

 全国首发 AMD Shanghai/上海性能评测

曙光I840四路六核Dunnington服务器评测

 


直联架构:Istanbul与Nehalem-EP

  作为Shanghai的升级产品,Istanbul在架构/微架构方面都和上一代比较相似。


AMD Istanbul/伊斯坦布尔架构图


AMD Shanghai/上海架构图

 
AMD Barcelona/巴塞罗那架构图

  就图上看,很明显的一个提升是HT总线的速率:Shanghai是24GB/s,Istanbul是57.6GB/s,不过真实的情况是:Shanghai标的速率是基于HT 1.0,Istanbul是HT 3.0。Shanghai也能提供HT 3.0总线的支持,不过由于芯片组的缘故,只能使用HT 1.0。本来AMD打算Istanbul发布的时候同时推出新的芯片组,不过现在来看,提前发布的它也只能使用HT 1.0了。我们收到的A840r-H确实使用了NVIDIA的nForce 3600芯片组,而不是原定配合的AMD Fiorano芯片组。


Istanbul:原定路线图

Istanbul HT总线的速度是这样子的:频率为2.4GHz(Shanghai为2.0GHz,在HT 1.0的时候频率为1.0GHz),基于DDR(双倍数据速率)的情况下就是4.8GT/s(giga transfer per second),而HT总线位宽是16位,因此就是9.6GB/s;考虑到双向传输的话,Istanbul每条HT 3.0能提供19.2GB/s的带宽,三条总线就是57.6GB/s的最高双向传输总带宽。作为对比,Intel Nehalem-EP带有两条QPI总线,频率为3.2GHz,6.4GT/s,12.8GB/s单向、25.6GB/s双向,51.2GB/s总双向带宽,单条QPI总线比HTT要大一些,不过总的传输带宽低一点:Nehalem-EP面向的是双路平台;四路平台的Nehalem-EX具有四条QPI总线,从外部总线上,倒是Intel要胜上一筹。


AMD六核心Istanbul伊斯坦布尔架构猜想图


AMD Shanghai/上海架构

 缓存的变化:


Shanghai Opteron 2378缓存架构

 


Istanbul Opteron 8431缓存架构

  值得一提的是Istanbul的缓存方面的变化,这个变化是在容量上。在架构上,Istanbul仍然是三层缓存,前面两层是独享,最后一层在所有核心中共享。

  容量上,Istanbul显得比较反常,因为四核心的Shanghai是6MB L3,Istanbul只有5MB,这样分到每个核心上就不足1MB了,其他层的缓存容量和Shanghai一致。为什么会具有更少的缓存呢?或许是为了降低一点缓存同步的压力。

 

 

 


AMD 六核心Istanbul/伊斯坦布尔处理器
 

AMD 六核心Istanbul/伊斯坦布尔处理器
 

AMD 六核心Istanbul/伊斯坦布尔处理器

AMD 六核心Istanbul/伊斯坦布尔处理器


AMD Shanghai/上海晶圆超级大图(2560x1742),包括了4个完整的四核上海CPU

 

 


Opteron 8431与Athlong II x4


AMD 六核心Istanbul/伊斯坦布尔处理器

  AMD 45nm Istanbul/伊斯坦布尔将会首先由GlobalFoundries公司生产,我们现在已经知道GlobalFoundries是AMD拆分出去的生产工厂成立的独立公司。拆分之后,AMD成为了一个Fabless的处理器设计公司。这个拆分应该有资产方面的因素,此外也有拓展生产工厂业务的考虑。现在GlobalFoundries的主顾除了AMD之外还有其他公司。


Computex 2009: GlobalFoundries展示的28nm SRAM Bulk, 32nm Test Chip SOI, 45nm Istanbul SOI

  在之前举行的台湾Computex 2009上,GlobalFoundries展示了45nm Istanbul晶圆(同时也展出了多种可以向AMD之外的客户提供的其它工艺)。IT168也派出了报道团参加:

台北电脑展盛大开幕 IT168派记者团赴台现场报 


GlobalFoundries 45nm Istanbul SOI Wafer
 

GlobalFoundries 45nm Istanbul SOI Wafer,你可以数一数每个CPU上面的核心数量

Diffused in Germany, Made in Malaysia
德国生产,马来西亚组装

  Istanbul晶圆由德国的Dresden德累斯顿的Fab 1 Module 1生产。

 

 


据称在相同的功耗下提升了30%的性能,至于“完美的执行”看一下就算了
 

  除了6个核心、双通道DDR2-800集成内存控制器和最多三条HT 3.0总线之外,Istanbul还提供了进化版的AMD-V 2.0,让“伊斯坦布尔”的虚拟化性能再度提升,并加入了新的AMD-P技术来更完美地控制处理器功耗,配合CoolCore和Smart Fetch技术可以限制内核功耗甚至关闭内核。

HT Assist:降低维持缓存一致性所需要的步骤,图上是从10个事务降低到只需要2个事务

HyperTransport  technology Assist (HT Assist):降低多个处理器之间的缓存探测,降低交通量,从而提升4路/8路服务器的性能,优化如数据库、虚拟化这样的缓存敏感应用以及计算密集型的应用。

缓存探测是什么?为了维护内容的一致性,在多个处理器共享的缓存内存必须要保持一致——也就是维持缓存一致性。在其中的一份页面被修改的时候,其他处理器通过“缓存探测”来检测到这个操作,从而进行维持一致性的举动。这个举动在不同的系统上可以不同,既可以是更新复制被修改过的的页面,也可以是使其他的副本无效。实际上,这个HT Assist和Intel 5000X芯片组上的Snoop Filter缓存功能是差不多的,只是它占用的是L3缓存,也因此在双路配置的时候,必须把HT Assist功能——通常BIOS里面叫做Probe Filter的选项关闭。

需要澄清的一点是,一些说法是使用HT Assist后四路系统内存带宽可以提升60%。不对,不是这样,只是在一些应用中具有这么高的提升,如图上所示的“STREAM Memory bandwidth,流操作内存带宽”。

Extended Migration扩展迁移:兼容所有的单核/双核/四核/六核处理器,允许虚拟机在不同系统之间进行自由迁移。


Intel VT-d:不是我不想用AMD的图,而是实在资料太少

AMD-Vi:I/O级别的虚拟化,允许多个虚拟机分别直接与I/O设备沟通(需要Fiorano平台:SR5690/SR5670芯片组),提供更好的设备隔离安全性和虚拟I/O性能。与Intel的VT-d有些类似,可以看这里:

从VT-x到VT-d Intel虚拟化技术发展蓝图

功耗:在功耗上,Istanbul/伊斯坦布尔虽然多了50%的核心,然而通过工艺上的进步,以及电源管理技术上的改进,最后仍然维持了和Shanghai处理器一致的ACP平均功耗,当然,对于这点,我们期望后面的测试可以给出准确的数值。

远程电源管理界面APML:提供一个远程监视、控制平台功耗的界面,无需进入BIOS调整。对于大规模数据中心来说,逐台服务器进入BIOS调整电源管理参数是很麻烦的,APML就是个很方便的解决方法。

服务器系统需要一颗处理器和BMC(管理处理器)来支持APML,并需要相关管理软件,我们也随A840r-H机器收到了曙光研发的电源管理软件。

 

 

AMD Istanbul/伊斯坦布尔规格表

名称

Opteron 2427Opteron 2431Opteron 2435Opteron 2439 SE Opteron 8431Opteron 8435Opteron 8439 SE
系列

双路

八路

主频

2.2GHz

2.4GHz

2.6GHz

2.8GHz

2.4GHz

2.6GHz

2.8GHz

HT频率

2.4GHz

HT速率

9.8GB/s(单向)
19.6GB/s(双向)

核心/线程

6/6

L2缓存

6x 512KB

L3缓存

5MB

ACP75W

  首先推出的Istanbul属两个系列:双路,以及八路(当然它们也能用于四路),型号分别是2427、2431、2435、2439 SE以及8431、8435、8439 SE,第一位数字表明面向多少路系统,第二位数字表明采用的插槽,虽然同样是Socket F 1207,不过规格和上一代23xx/83xx不同(如,支持DDR2 800等),最后两位数字代表着性能,更大的数字表示性能更强。额外的SE后缀是后来又推出的新版本,频率达到了2.8GHz。

 
Istanbul/伊斯坦布尔:AMD Opteron 8431处理器,频率2.4GHz,内置六个物理处理核心

  我们手上的A840r-H服务器使用的是8431。


早期的规格表上并没有2439 SE和8439 SE

 

CPU资料

缓存架构

曙光的主板,基于NVIDIA nForce Pro 3600芯片组

CPU:24个核心

任务管理器里的24个物理核心
1
相关文章