服务器 频道

英特尔32纳米至强5600处理器知识宝典

  【IT168 专稿】2010年,根据英特尔TICK-TOCK的策略,至强服务器不仅将延承Nehalem架构的诸多优势,还将进入全新的32纳米工艺时代。在基于英特尔平台的双路服务器市场,最值得期待的莫过于“采用32纳米工艺和Nehalem微架构,代号Westmere-EP的新一代至强5600系列处理器”。IT168服务器频道收集整理了关于至强5600的一些常见问题解答,希望能够帮助大家对这一代新产品有更清晰的认识。更多详细内容,请关注IT168评测中心3月17日的报告。

  问题1:与上一代至强5500相比,至强5600有哪些重要不同?

  同样针对双路服务器市场,跟至强5500相比,至强5600(代号:Westmere-EP)的重要变化在于:32纳米工艺、6核心12线程设计、3.46GHz的更高主频、12MB的更大L3缓存,以及在能耗管理方面的增强技术等。由于决定处理器最关键的因素有处理器微架构和制造工艺,至强5600仍然沿用了至强5500的Nehalem架构,因此,最重要的不同就在于32纳米工艺。和至强5500一样,至强5600采用相同的插槽、芯片组,同样具有两个QPI通道,三个内存通道,支持DDR3规格内存,主频范围基本相当,也支持超线程、Turbo Boost等技术。具体如下表所示:

英特尔至强5500与至强5600规格对照表
对比
至强5500
至强5600
发布时间
2009年3月31日
2010年3月16日
代号
Nehalem-EP
Westmere-EP
制程工艺
45纳米
32纳米
晶体管数
7.31亿
11.7亿
架构/芯片组
Intel 5520芯片组
Intel 5520芯片组
内核/线程
4核(E5502 是双核)
4
6
多线程
8线程
8线程
12线程
型号
8MB缓存、6.40 GT/秒QPI:W5590(3.33 GHz)、W5580(3.20 GHz)、X5570(2.93 GHz)、X5560(2.80 GHz)、X5550(2.66 GHz)
8MB缓存、5.86 GT/秒QPI:E5540(2.53 GHz)、E5530(2.40 GHz)、E5520(2.26 GHz)、L5530(2.40 GHz)、L5520(2.26 GHz)
4MB缓存、4.80 GT/秒QPI:E5506(2.13 GHz)、L5506(2.13 GHz)、E5504(2.00 GHz)、E5502(1.86 GHz)
7款:
L5609(1.86GHz)
L5630(2.13GHz)
E5620(2.4GHz)
E5630(2.53GHz)
E5640(2.66GHz)
X5667(3.06GHz)
X5677(3.46GHz)
6款:
W3680(3.33GHz)
L5640(2.26GHz)
X5650(2.66GHz)
X5660(2.8GHz)
X5670(2.93GHz)
X5680(3.33GHz)
主频
1.86GHz ~ 3.33GHz
1.86-3.46GHz
2.26-3.33GHz
QPI数量
2
2
2
QPI速率
4.80 GT/秒,5.86 GT/秒,6.40 GT/秒
6.40 GT/
6.40 GT/
L2缓存
4 x 256 KB
4 x 256 KB
6 x 256 KB
L3缓存
4MB/8MB共享
12MB共享
12MB共享
指令集/虚拟化
SSE,SSE2,SSE3,SSE4.2,Intel-VT,VT-d,Turbo Boost,Hyper-Threading
L5609不支持超线程和睿频加速
全部支持Turbo Boost睿频加速技术
内存控制器
集成内存控制器
集成内存控制器
集成内存控制器
三通道DDR3 800/1066/1333MHz
三通道DDR3 800/1066/1333MHz
三通道DDR3 800/1066/1333MHz
TDP功耗
60W,80W,95W,130W
40W,80W,95W,130W
60W,95W,130W
IT168服务器频道,2009年12月

     关于至强5600在架构工艺方面的细节,请参考:ISSCC 2010:深入32nm Westmere处理器

  问题2:与45纳米相比,32纳米工艺带来了什么样的进步?

  英特尔32纳米工艺由于采用了第二代高-K金属栅极晶体管技术,用于高K材料的等价氧化物(电介质)的厚度从45纳米工艺时的1纳米缩小至0.9纳米,栅极长度缩小到了30纳米,所以单位面积可以集成更多晶体管,处理器的同比封装尺寸将是45nm产品的70%;同时采用了第4代应变硅,电子在晶体管中的流通更顺畅,阻力更小,耗电更低。因此,相比较于45纳米,最新的32纳米处理器更小,更快,更强,更高能效。总之,32纳米工艺进一步提升了英特尔部署晶体管密度的能力,提升了单位晶体管的性能,降低了单位晶体管的能耗。因此,可以在相同成本下提高性能,在同样的功耗下提升主频,也可以加入更多内核,把缓存做得更大。比如,得益于工艺进步,与上一代产品中最高端的X5570(2.93GHz,95w)相比,L5640(6核,2.26GHz,60w)的性能相当,但功耗却降低了30%。

  32nm、6核心Westmere-EP核心照

  问题3:英特尔32纳米的处理器有哪些?

  32纳米制程工艺会被英特尔用来生产桌面、移动、服务器、嵌入式等面向不同领域的处理器产品。今年1月份英特尔已经发布了32纳米Core i5/i3处理器(Clarkdale),面向桌面台式机和单路服务器市场。3月中旬,英特尔将发布的是32纳米的至强5600系列(Westmere-EP),针对双路服务器市场。预计明后年,英特尔会推出32纳米的至强7000系列(Westmere-EX),针对四路以上的系统。对于四路以上服务器市场,英特尔对新技术的采取相对缓慢,往往比双路服务器要晚上一年左右,目前最新的进展是3月底将要发布的45纳米至强7500系列(Nehalem-EX)。

  问题4:什么是英特尔的钟摆模式(Tick-Tock)?

  就象钟表发出的滴嗒声一样,英特尔也希望其处理器发展能够象钟摆那样有规律,以协调英特尔内部产品研发、制造、市场等部门以及与外部软硬件合作伙伴的配套步伐,增强产品的市场竞争力。具体而言,Tick-Tock摆钟式的处理器发展战略,就是在奇数年推出新的制程工艺,偶数年推出新的处理器微架构,这样每两年,英特尔就可以将决定处理器的两大关键核心因素提升到一个新的层次。比如奇数年2005年推出65nm工艺、2007年推出45nm工艺、2009年推出32nm工艺;偶数年2006年推出让Core微架构、2008年推出具有划时代意义的Nehalem微架构、2010年计划推出新一代Sandy Bridge微架构。值得注意的是,英特尔的处理器包括桌面、移动、服务器等多种类型,虽然共享微架构和制程工艺的新技术,但这些处理器的具体发布时间并不相同。

  问题5:至强5600系列有哪些具体型号,都有什么规格?

  3月17日正式发布的首批至强5600系列共有13款型号,有6款4核版本和7款6核版本。

  6核12线程的“Xeon X5680/X5670/X5660/X5650/L5640”,主频从3.33GHz到2.26GHz不等,三级缓存12MB,热设计功耗最高端型号X5680 130W、低压版型号L5640 60W,其它均为95W,全部支持Turbo Boost睿频加速技术。

  4核8线程的“Xeon X5677/X5667/E5640/E5630/E5620/L5630/L5609”,主频从1.86GHz到3.46GHz不等,三级缓存容量同样是12MB,热设计功耗则有130W、95W、80W、40W四种,其中两款Xeon L5600系列低压版本都是40W,但是注意Xeon L5609不支持超线程和睿频加速技术。具体如下表所示:

型号
核心
线程
主频
三级缓存
睿频加速
热设计功耗
Xeon X5680
6
12
3.33GHz
12MB
+
130W
Xeon X5670
6
12
2.93GHz
12MB
+
95W
Xeon X5660
6
12
2.80GHz
12MB
+
95W
Xeon X5650
6
12
2.66GHz
12MB
+
95W
Xeon L5640
6
12
2.26GHz
12MB
+
60W
Xeon W3680
6
12
3.33GHz
12MB
+
130W
Xeon X5677
4
8
3.46GHz
12MB
+
130W
Xeon X5667
4
8
3.06GHz
12MB
+
95W
Xeon E5640
4
8
2.66GHz
12MB
+
80W
Xeon E5630
4
8
2.53GHz
12MB
+
80W
Xeon E5620
4
8
2.40GHz
12MB
+
80W
Xeon L5630
4
8
2.13GHz
12MB
+
40W
Xeon L5609
4
4
1.86GHz
12MB
-
40W

  问题6:与以前的处理器相比,至强5600的性能提升幅度有多大?

  至强5600由于采用了更先进的32纳米工艺,可以进一步提升主频,增加缓存,同时降低功耗,预计性能会比45纳米的至强5500高60%,如果与2005年的单核至强处理器相比,性能高达15倍之多。换句话说,今天的一台至强5600服务器相当于5年前单核服务器的15台。更多内容,请关注IT168评测中心3月17日发布的报告。

  问题7:至强5600在节能方面有哪些改进?

  在自适应能效方面,至强5600主要在4个方面进行了改进:

  一是CPU功耗更低,每瓦特性能更高,六核版本至强5600的最低功耗为60W,四核版本至强5600的最低功耗只有40W。

  二是增强了智能节能技术,可以调节六个内核以及uncore部分的能耗状态,性能功耗比更接近理想的线性状态。与Xeon 5500一样,至强5600芯片还是被分为“Core”和“Uncore”部分。在Nehalem微构架中英特尔为每个核心引入了Power Gate(功率门限)技术,6个核心区域具有独立的时钟频率和供电部分。关闭空闲的核心,芯片的Uncore区域保持满功率运行,核心的状态被存储在芯片缓存中,这样可以降低处理器的能耗。L3缓存和内存控制器位于芯片的“Uncore”区域,也具有了独立的Power gate,使得芯片在实际应用中会更加节能。

  三是处理器内核的能耗管理算法进行了更新,可以让Turbo Boost睿频更高效,同时对内存的能耗管理做到更精细化。

  四是Westmere-EP所集成的内存控制器提供了对1.35v低电压DDR3内存的支持,而标准的DDR3电压为1.5v。支持低电压内存的实际效果是在不牺牲性能的前提下可以降低20%的热量。

  问题8:如果用新服务器去整合老旧服务器上的应用,多久能收回投资?

  根据Gartner统计,去年由于受经济危机影响,全球大约有100万台服务器的升级计划受到延缓。2010年,随着经济形势转好,服务器更新带来了可观的市场机会。另外,根据IDC在去年第三季度发布的统计数据,全球市场中仍然保有38%的单核服务器和42%的双核服务器。由于至强5600的性能是单核至强的15倍,更新服务器可以带来维护管理成本、空间成本、电力成本、软件许可证费用的极大节省,因此也有望引发新一轮的服务器更新换代潮。

    如果利用至强5600来对这些单核产品进行15:1的整合,每年可以节省95%的电力支出,得益于电力、软件方面的成本节省,仅5个月就可以收回投资。如果实现1:1的替换,性能可以提高15倍,预计每年电力支出可以减少8%。

  英特尔、惠普等公司都提供了投资回报率(ROI)的计算器,有兴趣的朋友可以参考使用:

  惠普ProLiant G6 ROI计算器

  英特尔至强服务器更新换代ROI计算器

  

  问题9:从至强5500升级到至强5600平台,是否方便?

  对于至强5500服务器用户来说,至强5600的最大好处就在于使用相同的平台——Intel 5520芯片组,无须更换主板,只刷新BIOS,就可以进行升级,从而获得最高60%的性能提升。

  问题10:支持至强5600的英特尔服务器主板有哪些?

  虽然现有的至强5500主板可以通过刷新BIOS进行升级,但为更好发支持至强5600,英特尔也会发布新的主板,预计包括Intel S5520UR (Urbanna)、S5520HC/S5500HCV (Hanlan Creek)、S5500BC (Bluff Creek)、S5500WB (Willowbrook)和S5520SC (Shady Cove)等。

  问题11:至强5600服务器平台在I/O方面有哪些改进?

  在一个向上扩展的多核系统中,数据存取的层次是CPU、缓存、内存、硬盘,越往外层,I/O越慢,因此,随着CPU的核心数量越多,CPU喂不饱的现象会更加严重,I/O因此成为多核计算之路上最重要的因素。

  从至强5500开始,英特尔就已经引入QPI总线,集成内存控制器,以满足CPU与CPU之间、CPU与内存之间的快速数据传输,QPI传输带宽高达6.4GT/s,以完全取代过去一直制约服务器I/O的前端总线架构。

  而在至强5600中,一方面将L3缓存由上一代的8MB增加到了12MB,可以进一步降低内存延迟,同时提升大数据量计算时处理器的性能;另一方面,英特尔对于整个双路服务器平台的I/O方面进行了配套改进,如采用10GbE万兆以太网技术、SSD固态硬盘技术等。在目前处理器核心越来越多、性能越来越强的情况下,大部分服务器系统却仍然局限在1Gb的网络带宽,性能无法得到充分的发挥,如果使用10GbE技术,系统的IO瓶颈有望得到解决。

  问题12:至强5600在安全性方面有哪些改进?

  随着虚拟化、云计算应用的普及,对于底层硬件平台的安全性要求也越来越高。在至强5600中,英特尔新增加了两项技术:AES-NI加密指令集和Intel TXT可信执行技术。

  工艺进步让英特尔的设计工程师有了更多晶体管资源预算来增加新的功能,比如在45纳米时,在Penryn处理器中增加了SSE4.1指令集,而在32纳米的Westmere中,英特尔又新加了AES(Advanced Encryption Standard)指令集,专门用来加密数据。AES加密处理是对输入的128位明文,使用加密的密钥通过有限次的迭代运算(每一次称为一轮:round)最终得到128位的加密块。解密遵循相反的过程,迭代次数一样,但是需要“解密密钥”而不是加密的“密钥”。在每一轮加密解密中都使用不同的阶段密钥,由原始密钥通过密钥序列算法生成。AES的标准密钥分为128,192和256位,各自对应的迭代次数为10、12和14轮。

  Intel的AES增强指令集包括了下面7条指令,分成两部分:Carry-less Multiplication Instruction(无进位乘法指令):一条单独的无进位乘法指令(Carry-less Multiplication):PCLMULQDQ,一次可以处理两个64位宽度的数据。不进位乘法是实现GCM(Galois Counter Mode)的重要部分。GCM 是对称加密算法分组密码的一种工作模式。分组密码工作模式可以分为加密模式、认证模式和认证加密模式等。GCM模式为认证模式的一种,提供认证和加密两种功能。GCM在IEEE 802.1ae标准、IPsec(RFC 4106)、P1619存储标准和SPoFC(Security Protocols over Fiber Channel,ISO-T11的一个标准)中都有应用。另一部分是AES Extension Instructions(AES扩展指令),包括两条AES加密迭代加速:AESENC和AESENCLAST,两条AES解密迭代加速:AESDEC和AESDECLAST,两条密钥序列生成:AESIMC和AESKEYGENASSIST。

  在安全性方面,英特尔还引入了早先就有的Intel Trusted Execution Technology可信赖计算技术。Intel TXT所能够提供的功能主要包括: Protected Execution:在未取得系统授权的情况下无法执行其它软件。Sealed Storage:提供硬件加密及存储序列号,使其无法在其它平台中开启并使用。Protected Input:所有输入端均需要认证,如USB设备,在无序列号时无法开启使用。Protected Graphics:不允许输出画面被非法截取。Protected Launch:可以控制操作系统及应用软件不会被开始或进行其它动作。

  Intel TXT能保护虚拟化运算环境下的数据,配合英特尔新一代的虚拟化技术–Intel Virtualization Technology for Directed I/O之后,Intel TXT可确保虚拟机器监控程序 (virtual machine monitor) 更强的抗攻击能力,可发现目前传统软件信息安全解决方案无法侦测到的攻击。透过这种硬件防护隔离指定的内存,系统能保护各分隔虚拟环境下的数据,避免其它分隔环境内的软件进行未经授权的存取。

  问题13:英特尔的“智能计算”概念是什么意思?

  由于IT环境正在快速变化,今天IT系统要面对的应用和工作负载的各类非常多,因此整个IT基础设施往智能方向转变是一种必然。无论是数据中心,还是云计算,上面跑的应用负载种类非常多,而不同的工作负载对于底层计算的需求是不一样的,有的是计算密集型,有的是内存密集型,有的是单线程应用,有的则需要多线程并行。真正的智能计算就是要让系统感知到它是一种什么样的负载,然后自动地满足负载的计算性能需求,表现为“按需、自动、可扩展”三大特征。

  英特尔在2009年至强5500服务器发布时引入了“智能计算”这一表概念,其具体技术主要集中在智能性能、智能节能、虚拟化三个方面,比如智能睿频加速(Turbo Boost)技术可以自动地感知工作负载,采取关闭核心、提升主频的措施,超线程技术可以针对多线程优化比较好的应用启动多线程并发执行功能,智能节能技术可以对内核与非内核部分的功耗进行精细化管理,Intel VT硬件辅助虚拟化技术可以提高虚拟化效率。在至强5600中,英特尔仍然延续智能计算的理念,并有所增强。具体参见:解读英特尔服务器新主张:“智能计算”

0
相关文章