服务器 频道

英特尔Nehalem-EX处理器常见问题解答

  【IT168 专稿】如果说2010年X86服务器市场最大的看点是什么?无疑是四路以上的企业级服务器。在这个领域,我们会迎来一个堪称革命性的全新平台:英特尔Nehalem-EX(至强7500/至强6500),以取代2008年9月发布的六核至强7400系列(代号Dunnington)。

  什么是Nehalem-EX?

  Nehalem-EX是英特尔最新一代智能可扩展的高端服务器处理器平台,包括支持四插槽以上系统的至强7500系列与支持双插槽系统的至强6500。

  Nehalem-EX采用英特尔45纳米高K金属栅极制程工艺和Nehalem微体系架构。每颗处理器集成了23亿颗晶体管,最多集成 8 个内核,每个核心支持双线程,每颗处理器最多可支持16个线程并行处理;配合英特尔的睿频技术,CPU的主频可以动态调整;每处理器最多带有4条QPI高速互联,可轻松扩展至8路系统,如果加入第三方节点控制器则可扩展至更多路系统;每处理器最大共享24MB L3缓存,借助可扩展内存缓冲和可扩展内存互连技术,每个处理器可支持16个内存插槽,四路服务器最大内存容量可达到512GB DDR3。而且,Nehalem-EX引入了22条RAS特性,并首次在至强平台上实现了IA64上才有的MCA恢复功能,提供更强的可靠性。

  因此,Nehalem-EX将定位于服务器整合、虚拟化、数据处理需求庞大的企业应用以及高性能技术计算等环境,同时吸引使用RISC小型机的用户迁移到至强平台上来。

  Nehalem-EX家族处理器有哪些型号规格?

  英特尔Nehalem-EX家族分为两个系列:支持四插槽以上系统的至强7500与支持双插槽系统的至强6500。预计3月底将发布11款处理器,其中8款至强7500和3款至强6500,主频在1.73-2.66GHz之间,均有4核、6核与8核的版本,L3缓存也有所不同。具体如下表所示:

英特尔Nehalem-EX处理器型号规格表
型号
主频(GHz)
L3缓存 (MB)
QPI速率(GT/s)
DDR3主频(MHz)
TDP功耗(W)
内核数
线程数
Turbo-Boost睿频技术
TPC-C性能比
E6510
1.73
12
2x4.8
4xDDR3-1066
105
4
8
——
0.44
E6540
2.00
18
2x6.4
4xDDR3-1066
105
6
12
0/1/1/2
0.72
X6550
2.00
18
2x6.4
4xDDR3-1066
130
8
16
1/2/3/3
0.89
E7520
1.86
18
3x4.8
4xDDR3-1066
95
4
8
——
0.49
E7530
1.86
12
3x5.8
4xDDR3-1066
105
6
12
0/1/1/2
0.65
E7540
2.00
18
4x6.4
4xDDR3-1066
105
6
12
0/1/1/2
0.72
X7542
2.66
18
4x5.8
4xDDR3-1066
130
6
6
0/1/1/1
0.60
L7545
1.86
18
4x5.8
4xDDR3-1066
95
6
12
0/1/3/5
0.69
X7550
2.00
18
4x6.4
4xDDR3-1066
130
8
16
1/2/3/3
0.89
L7555
1.86
24
4x5.8
4xDDR3-1066
95
8
16
1/2/4/5
0.91
X7560
2.26
24
4x6.4
4xDDR3-1066
130
8
16
1/2/3/3
1.00

  注:

  1)TPC-C性能数据来源于思科,仅供参考。

  2)出于稳定性考虑,目前内存频率最高只支持到1066MHz,预计未来会升级到1333MHz。

  3)Turbo-Boost一栏是该款处理器在使用不同工作内核数时主频可提高的增量,1个增量为133MHz,分为7-8个核心、5-6个核心、3-4个核心、1-2个核心共4个区段,一般工作内核越多,可进一步提升主频的空间越小。如L7555的1/2/4/5表示,在使用7-8个核心时,主频增量为1,即只能再提高133MHz,而使用1-2个核心时,增量可达5,即主频可再提高666MHz。

  可见,Nehalem-EX完全打破了传统单路、双路、四路平台的简单划分。至强6500系列的推出主要是考虑到了部分应用对于大容量内存扩展的需求——它可以扩展到32根内存DIMM,而至强5600一般最多只有18根DIMM(思科UCS和IBM eX5由于使用了独特的内存扩展技术,属例外)。比如,有一些高性能计算用户只需要两颗处理器,但需要极大的内存带宽和I/O带宽,过去的双路服务器提供不了那么大的内存,无奈之举是买台配两颗CPU的四路服务器,但由于四路服务器售价高出许多,从而造成了投资浪费。为此,英特尔在新一代的Nehalem-EX中,提供了至强6500的双路平台,可以满足这些内存密集型用户的需要。

  另外,与同样针对双路平台的至强5600系列(Westmere-EP)相比,至强6500在核心数量、主频、L3缓存、RAS特性等方面也有不同(至强5600系列规格列表http://server.it168.com/a2010/0311/859/000000859434_4.shtml),因此,这两款产品的定位是完全不同的,至强5600无疑针对主流双路市场,而至强6500针对的是对内存容量有特殊需求的细分市场。

  八核心版本的Nehalem-EX内部结构是怎样的?

  Nehalem-EX是x86架构中第一款具有8个核心的产品,配置了24MB的共享L3缓存。基本构成是处理器核心分布在四个角落,所有核心共享的L3缓存则居于内核中部,在内核正中央则具有两个Hub集线器和一个Router路由器来负责所有核心的数据共享,管理内存、QPI以及L3缓存之间的数据流向。Nehalem-EX在核心正上面具有4个QPI——QuickPath Interconnect总线,核心正下方则是两个内存界面,总共有4个DDR3内存通道。更多内容,请参见:透视八核心至强Nehalem-EX处理器解析

  8核心版本Nehalem-EX处理器结构图

  Nehalem-EX平台的内存扩展性如何?

  一颗Nehalem-EX处理器可以支持16根DIMM内存条。如使用8GB容量的内存条,双路Nehalem-EX平台最多32个DIMM,内存容量可达256GB;4路Nehalem-EX平台最多64个DIMM,内存容量可达512GB;8路Nehalem-EX平台,最多128个DIMM,内存容量可达1TB。

  4路Nehalem-EX平台,64个线程,最多64个DIMM,内存容量可达512GB

  值得一提的是,Nehalem-EX在CPU内存控制器和内存之间设置了一个芯片,起到缓冲的作用。其实就相当于把过去FB-DIMM内存上的缓冲芯片集中起来放到一个桥接芯片中,达到一种平衡,既要节省一部分能耗,又要保证过去FB-DIMM带来的好处,提高内存容量,保证内存工作主频和带宽不降低。

  不过,为了保证系统的稳定,目前Nehalem-EX平台的内存速率最高只有1066MHz,预计以后会升级到1333MHz。

  与上一代六核至强7400相比,至强7500有什么不同?

  与至强7400相比,虽然至强7500仍然使用45纳米工艺,但架构发生了重大变革,从传统的前端总线结构变成了全新的Nehalem直联架构(了解Nehalem架构),具体体现在:

  1)使用QPI总线,取代前端总线架构,最多拥有4条QPI Link;

  2)集成DDR3内存控制器,有4个内存通道接口,通过设置外置缓冲芯片,每处理器最多支持16条内存;

  3)最多拥有8个内核,支持睿频技术,可动态调节工作核心主频;

  4)采用超线程技术,每CPU可实现16个线程并行;

  5)23亿个晶体管,L3缓存由16MB提升到24MB;

  6)RAS特性更多,增加了原来只在安腾处理器上才有的MCA(Machine Check Architecture)机器校验恢复功能,检测CPU、内存、I/O的错误,并和OS协作纠正,并可以从严重错误中恢复。

  两者的规格区别如下表所示: 

至强7400与至强7500处理器规格对照表
对比
Dunnington
Nehalem-EX/Beckton
发布时间
2008年9月
2010年3月
系列名称
Xeon 74xx
Xeon 75xx
CPU主频范围
2.133 Ghz - 2.667 Ghz
1.86GHz-2.66GHz之间
型号与主频
E7420(2.133GHz)、E7430(2.133GHz)、E7440(2.4GHz)、L7445(2.133GHz)、L7455(2.133GHz)、E7450(2.4GHz)、E7458(2.4GHz)、E7460(2.667GHz)
E7520(1.86 GHz)、E7530(1.86GHz)、E7540(2.00GHz)、X7542(2.66GHz)、L7545(1.86GHz)、X7550(2.00GHz)、L7555(1.86GHz)、X7560(2.26GHz)
生产工艺
45nm
45nm
晶体管数量
19亿
23亿
Nehalem
4核,6核
4核,6核,8核
线程数
每核1线程,每CPU最多6线程
每核2线程,每CPU最多16线程
1066 MHz
——
QPI总线
——
3个或4个QPI,速率有4.8GT/s、5.8GT/s、6.4GT/s三种
集成内存控制器
内存支持
最高达256GB FB-DIMM内存
集成4个DDR3内存通道,每CPU最多支持16个内存DIMM,四路系统内存容量最高512GB
L2缓存
2x3 MB,3x3 MB
每核256KB
L3缓存
8MB,12MB,16 MB
12MB、18MB、24MB共享
CPU插座
Socket 604
Socket LS,又叫LGA1567
TDP功耗
50W,65W,90W,130W
95W,105W,130W
应用领域
四路服务器,8路以上系统需要第三方芯片支持
四路以上,无须第三方控制器即可扩展至8路系统
支持特性
MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, Demand Based Switching (Intel's Server EIST), Intel 64, XD bit (an NX bit implementation), Intel VT
增加HT超线程技术、睿频智能加速及MCA等更多RAS特性。

  与上一代至强7400相比,至强7500的性能提升幅度有多大?

  据称Nehalem-EX会为四路以上服务器带来“革命性”的性能提升,内存带宽比至强7400高9倍,运行数据库程序时的性能则是后者的2.5倍,整数运算性能为至强7400的1.7倍,浮点运算性能则是至强7400的2.2倍,实现英特尔多路服务器处理器两代产品间前所未有的性能飞跃。

  至强7500对八路服务器市场会带来什么样的影响?

  得益于至强7500处理器中的四条高带宽快速通道互联(QPI)链接,今天服务器厂商可以非常容易地通过QPI构建出一套八路系统出来,有些厂商还可以通过自身的节点控制器技术扩展到32路。预计至强7500发布时全球会有8个OEM厂商推出15款八路和八路以上的系统。2007年,8路以上的IA架构服务器还只有IBM、NEC和Unisys在提供,而到了今年,这一阵营将扩大到十来家,除了上述三家,还包括SGI、惠普、富士通、浪潮、布尔、Sun等。因此,过去,由于八路服务器的设计和制造困难,售价往往比普通四路服务器高出几倍,技术也只掌握在少数几个厂商手中,从而限制了八路系统的需求。而随着至强7500的到来,预计未来八路与四路的售价比例的格局会被打破。

  8路Nehalem-EX平台,128个线程,最多128个DIMM,内存容量可达1TB

  值得注意的是,在构建八路以上服务器系统时,至强7500仍然给服务器厂商提供了较大的创新空间,各厂商可以根据自身能力和市场策略来选择。主要体现在两个方面:一是在架构创新方面,可以直接使用QPI来连接构建一个成本适中的八路系统,也有的厂商使用自己的节点控制器,用到的协议和最终效率都会不同。二是虽然至强7500提供了二三十个RAS功能,但并不是所有厂商都需要或者有能力去实现这些功能,比如硬件分区、CPU热添加/热删除、内存板的热添加/热删除,不同厂商会有各自的考虑。

  Nehalem-EX/至强7500在RAS特性方面能否与RSIC小型机抗衡?

  和双路平台不同,多路平台不仅要求更高的性能,也要有更强的稳定性。一直以来,X86服务器在同RISC小型机竞争时,在RAS(Reliability可靠性、Availability 可用性和Serviceability可服务性)方面往往处于下风,这也是一些关键领域的小型机用户迟迟不敢向X86/Linux开放平台迁移的重要原因之一。

  Nehalem-EX的出现,将X86系统的RAS特性提高到了一个全新的水平,这些技术多达22条,集中解决三个方面的问题:一是数据保护,可以诊断哪些数据出错,利用CRC、ECC校验来纠正错误,如果不能纠正,可以把这些坏的数据进行隔离,以保证不影响其他数据,避免系统的重启和宕机。二是高可用设计,包括QPI Link之间的互备和热切换,内存和CPU的热切换、故障预警机制等等,以保证系统的高可用。三是降低系统计划内的宕机时间,包括系统分区管理技术、CPU和内存的热添加和热移除等。具体如下表所示:

Nehalem-EX处理器的22项RAS特性
方面
功能
技术
数据保护
l         减少关键级的错误
l         全系统数据错误检测
l         限制错误所产生的影响
1.       Parity checking and ECC 寄偶检验与ECC
2.       Memory Themal Throttling 内存热量分流
3.       Memory demand & patrol scrubbing 内存需求与巡视清除
4.       Corrupt data containment 计算数据防泄漏
5.       QPI viral mode QPI防病毒模式
6.       QPI rolling CRC QPI卷动CRC检验
高可用
l         恢复失效的数据连接
l         从失效的CPU与内存上迁移工作负载
l         从无法修正的错误中恢复
l         帮助进行故障预测
1.       Intel SMI Lane Failover 内存控制器(SMI)通道容错
2.       Intel SMI Clock Fail Over 内存控制器时钟容错
3.       Intel SMI & QPI Packet Retry 内存控制器与QPI包重试
4.       QPI Clock Fail Over QPI时钟容错
5.       QPI Self-Healing QPI自我修复
6.       SDDC plus random bit error recovery 单设备失效代码与随机位错误恢复
7.       Memory Mirroring 内存镜像
8.       Memory DIMM and Rank Spaning 内存DIMM与列(RANK)广度
9.       Dynamic CPU and memory migration CPU与内存动态迁移
10.    MCA-recovery with OS support 操作系统支持MCA恢复
减少计划内宕机时间
l         维护模块化分区而非整个系统
l         预先替换将失效的组件
1.       Static system partitioning 静态系统分区
2.       MCA error logging(CMCI) with OS predictive failure analysis 基于操作系统预知失效分析的MAC错误记录
3.       Physical Memory Board Hot Add/remove 物理内存卡热添加与移除
4.       Dynamic/OS Memory On-lining(capacity change) 动态/OS内存在线(容量变更)
5.       Physical CPU Board Hot Add/remove 物理CPU卡添加/移除
6.       OS CPU on-lining(capacity change)OS处理器在线(容量变更)

  这里特别值得一提的就是,Nehalem-EX增加了原来只在安腾处理器上才有的MCA(Machine Check Architecture)机器校验恢复功能。这个功能可以在不关机的情况下检查和纠正处理器、内存或者IO中的错误,这对于虚拟化环境非常重要。在虚拟化环境中,要关机查找和修复故障意味着必须迁移所有的虚拟机,如采用机器检查恢复功能,这个故障可以隔离,不必迁移所有的虚拟机。目前,包括微软Windows Server、Redhat、SuseLinux以及VMware都已经支持这一功能。

  可以说,Nehalem-EX已经拥有X86系统里较高级别的RAS特性,而且与小型机相比,差距也已经不大。但需要注意的是,这些RAS特性的最终实现需要系统厂商和软件厂商的支持。目前,在操作系统和虚拟化方面,Novell、Redhat、微软和VMware都已经做好准备,为至强7500中的高级RAS特性提供支持,以保证可以将这些功能提供给上层的应用软件使用。另一方面,虽然至强7500提供了20多个RAS功能,但并不是所有服务器厂商都需要或者有能力去实现这些功能,比如硬件分区、CPU热添加/热删除、内存板的热添加/热移除,不同厂商会有各自的考虑。这些都需要用户在方案选型时加以考虑。

  随着Nehalem-EX往高端走,与英特尔的非X86平台安腾(Tukwila)系列如何区隔?

  在性能、可靠性和扩展性方面,至强7500和安腾都具备在关键业务计算领域内的能力,两者的关键不同在于客户对操作系统和可用应用软件的选择,甚至包含对OEM厂商的选择。用户可以从这三个方面来选择安腾或者至强7500,比如要用HP-UX或者一些大机操作系统的用户,当然选安腾,而对于Windows和LINUX应用则推荐至强7500。另外,虽然Nehalem-EX中引入了原来安腾上才有的MCA功能,但还有一些RAS特性是至强所没有的,比如智能锁步的功能。

0
相关文章