【IT168 专稿】如果说2010年X86服务器市场最大的看点是什么?无疑是四路以上的企业级服务器。在这个领域,我们会迎来一个堪称革命性的全新平台:英特尔Nehalem-EX(至强7500/至强6500),以取代2008年9月发布的六核至强7400系列(代号Dunnington)。
什么是Nehalem-EX?
Nehalem-EX是英特尔最新一代智能可扩展的高端服务器处理器平台,包括支持四插槽以上系统的至强7500系列与支持双插槽系统的至强6500。
Nehalem-EX采用英特尔45纳米高K金属栅极制程工艺和Nehalem微体系架构。每颗处理器集成了23亿颗晶体管,最多集成 8 个内核,每个核心支持双线程,每颗处理器最多可支持16个线程并行处理;配合英特尔的睿频技术,CPU的主频可以动态调整;每处理器最多带有4条QPI高速互联,可轻松扩展至8路系统,如果加入第三方节点控制器则可扩展至更多路系统;每处理器最大共享24MB L3缓存,借助可扩展内存缓冲和可扩展内存互连技术,每个处理器可支持16个内存插槽,四路服务器最大内存容量可达到512GB DDR3。而且,Nehalem-EX引入了22条RAS特性,并首次在至强平台上实现了IA64上才有的MCA恢复功能,提供更强的可靠性。
因此,Nehalem-EX将定位于服务器整合、虚拟化、数据处理需求庞大的企业应用以及高性能技术计算等环境,同时吸引使用RISC小型机的用户迁移到至强平台上来。
Nehalem-EX家族处理器有哪些型号规格?
英特尔Nehalem-EX家族分为两个系列:支持四插槽以上系统的至强7500与支持双插槽系统的至强6500。预计3月底将发布11款处理器,其中8款至强7500和3款至强6500,主频在1.73-2.66GHz之间,均有4核、6核与8核的版本,L3缓存也有所不同。具体如下表所示:
英特尔Nehalem-EX处理器型号规格表 | |||||||||
型号 | 主频(GHz) | L3缓存 (MB) | QPI速率(GT/s) | DDR3主频(MHz) | TDP功耗(W) | 内核数 | 线程数 | Turbo-Boost睿频技术 | TPC-C性能比 |
E6510 | 1.73 | 12 | 2x4.8 | 4xDDR3-1066 | 105 | 4 | 8 | —— | 0.44 |
E6540 | 2.00 | 18 | 2x6.4 | 4xDDR3-1066 | 105 | 6 | 12 | 0/1/1/2 | 0.72 |
X6550 | 2.00 | 18 | 2x6.4 | 4xDDR3-1066 | 130 | 8 | 16 | 1/2/3/3 | 0.89 |
E7520 | 1.86 | 18 | 3x4.8 | 4xDDR3-1066 | 95 | 4 | 8 | —— | 0.49 |
E7530 | 1.86 | 12 | 3x5.8 | 4xDDR3-1066 | 105 | 6 | 12 | 0/1/1/2 | 0.65 |
E7540 | 2.00 | 18 | 4x6.4 | 4xDDR3-1066 | 105 | 6 | 12 | 0/1/1/2 | 0.72 |
X7542 | 2.66 | 18 | 4x5.8 | 4xDDR3-1066 | 130 | 6 | 6 | 0/1/1/1 | 0.60 |
L7545 | 1.86 | 18 | 4x5.8 | 4xDDR3-1066 | 95 | 6 | 12 | 0/1/3/5 | 0.69 |
X7550 | 2.00 | 18 | 4x6.4 | 4xDDR3-1066 | 130 | 8 | 16 | 1/2/3/3 | 0.89 |
L7555 | 1.86 | 24 | 4x5.8 | 4xDDR3-1066 | 95 | 8 | 16 | 1/2/4/5 | 0.91 |
X7560 | 2.26 | 24 | 4x6.4 | 4xDDR3-1066 | 130 | 8 | 16 | 1/2/3/3 | 1.00 |
注:
1)TPC-C性能数据来源于思科,仅供参考。
2)出于稳定性考虑,目前内存频率最高只支持到1066MHz,预计未来会升级到1333MHz。
3)Turbo-Boost一栏是该款处理器在使用不同工作内核数时主频可提高的增量,1个增量为133MHz,分为7-8个核心、5-6个核心、3-4个核心、1-2个核心共4个区段,一般工作内核越多,可进一步提升主频的空间越小。如L7555的1/2/4/5表示,在使用7-8个核心时,主频增量为1,即只能再提高133MHz,而使用1-2个核心时,增量可达5,即主频可再提高666MHz。
可见,Nehalem-EX完全打破了传统单路、双路、四路平台的简单划分。至强6500系列的推出主要是考虑到了部分应用对于大容量内存扩展的需求——它可以扩展到32根内存DIMM,而至强5600一般最多只有18根DIMM(思科UCS和IBM eX5由于使用了独特的内存扩展技术,属例外)。比如,有一些高性能计算用户只需要两颗处理器,但需要极大的内存带宽和I/O带宽,过去的双路服务器提供不了那么大的内存,无奈之举是买台配两颗CPU的四路服务器,但由于四路服务器售价高出许多,从而造成了投资浪费。为此,英特尔在新一代的Nehalem-EX中,提供了至强6500的双路平台,可以满足这些内存密集型用户的需要。
另外,与同样针对双路平台的至强5600系列(Westmere-EP)相比,至强6500在核心数量、主频、L3缓存、RAS特性等方面也有不同(至强5600系列规格列表http://server.it168.com/a2010/0311/859/000000859434_4.shtml),因此,这两款产品的定位是完全不同的,至强5600无疑针对主流双路市场,而至强6500针对的是对内存容量有特殊需求的细分市场。
八核心版本的Nehalem-EX内部结构是怎样的?
Nehalem-EX是x86架构中第一款具有8个核心的产品,配置了24MB的共享L3缓存。基本构成是处理器核心分布在四个角落,所有核心共享的L3缓存则居于内核中部,在内核正中央则具有两个Hub集线器和一个Router路由器来负责所有核心的数据共享,管理内存、QPI以及L3缓存之间的数据流向。Nehalem-EX在核心正上面具有4个QPI——QuickPath Interconnect总线,核心正下方则是两个内存界面,总共有4个DDR3内存通道。更多内容,请参见:透视八核心至强Nehalem-EX处理器解析
8核心版本Nehalem-EX处理器结构图
Nehalem-EX平台的内存扩展性如何?
一颗Nehalem-EX处理器可以支持16根DIMM内存条。如使用8GB容量的内存条,双路Nehalem-EX平台最多32个DIMM,内存容量可达256GB;4路Nehalem-EX平台最多64个DIMM,内存容量可达512GB;8路Nehalem-EX平台,最多128个DIMM,内存容量可达1TB。
4路Nehalem-EX平台,64个线程,最多64个DIMM,内存容量可达512GB
值得一提的是,Nehalem-EX在CPU内存控制器和内存之间设置了一个芯片,起到缓冲的作用。其实就相当于把过去FB-DIMM内存上的缓冲芯片集中起来放到一个桥接芯片中,达到一种平衡,既要节省一部分能耗,又要保证过去FB-DIMM带来的好处,提高内存容量,保证内存工作主频和带宽不降低。
不过,为了保证系统的稳定,目前Nehalem-EX平台的内存速率最高只有1066MHz,预计以后会升级到1333MHz。
与上一代六核至强7400相比,至强7500有什么不同?
与至强7400相比,虽然至强7500仍然使用45纳米工艺,但架构发生了重大变革,从传统的前端总线结构变成了全新的Nehalem直联架构(了解Nehalem架构),具体体现在:
1)使用QPI总线,取代前端总线架构,最多拥有4条QPI Link;
2)集成DDR3内存控制器,有4个内存通道接口,通过设置外置缓冲芯片,每处理器最多支持16条内存;
3)最多拥有8个内核,支持睿频技术,可动态调节工作核心主频;
4)采用超线程技术,每CPU可实现16个线程并行;
5)23亿个晶体管,L3缓存由16MB提升到24MB;
6)RAS特性更多,增加了原来只在安腾处理器上才有的MCA(Machine Check Architecture)机器校验恢复功能,检测CPU、内存、I/O的错误,并和OS协作纠正,并可以从严重错误中恢复。
两者的规格区别如下表所示:
至强7400与至强7500处理器规格对照表 | ||
对比 | Dunnington | Nehalem-EX/Beckton |
发布时间 | 2008年9月 | 2010年3月 |
系列名称 | Xeon 74xx | Xeon 75xx |
CPU主频范围 | 2.133 Ghz - 2.667 Ghz | 1.86GHz-2.66GHz之间 |
型号与主频 | E7420(2.133GHz)、E7430(2.133GHz)、E7440(2.4GHz)、L7445(2.133GHz)、L7455(2.133GHz)、E7450(2.4GHz)、E7458(2.4GHz)、E7460(2.667GHz) | E7520(1.86 GHz)、E7530(1.86GHz)、E7540(2.00GHz)、X7542(2.66GHz)、L7545(1.86GHz)、X7550(2.00GHz)、L7555(1.86GHz)、X7560(2.26GHz) |
生产工艺 | 45nm | 45nm |
晶体管数量 | 19亿 | 23亿 |
Nehalem | ||
4核,6核 | 4核,6核,8核 | |
线程数 | 每核1线程,每CPU最多6线程 | 每核2线程,每CPU最多16线程 |
1066 MHz | —— | |
QPI总线 | —— | 3个或4个QPI,速率有4.8GT/s、5.8GT/s、6.4GT/s三种 |
集成内存控制器 | 无 | 有 |
内存支持 | 最高达256GB FB-DIMM内存 | 集成4个DDR3内存通道,每CPU最多支持16个内存DIMM,四路系统内存容量最高512GB |
L2缓存 | 2x3 MB,3x3 MB | 每核256KB |
L3缓存 | 8MB,12MB,16 MB | 12MB、18MB、24MB共享 |
CPU插座 | Socket 604 | Socket LS,又叫LGA1567 |
TDP功耗 | 50W,65W,90W,130W | 95W,105W,130W |
应用领域 | 四路服务器,8路以上系统需要第三方芯片支持 | 四路以上,无须第三方控制器即可扩展至8路系统 |
支持特性 | MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, Demand Based Switching (Intel's Server EIST), Intel 64, XD bit (an NX bit implementation), Intel VT | 增加HT超线程技术、睿频智能加速及MCA等更多RAS特性。 |
与上一代至强7400相比,至强7500的性能提升幅度有多大?
据称Nehalem-EX会为四路以上服务器带来“革命性”的性能提升,内存带宽比至强7400高9倍,运行数据库程序时的性能则是后者的2.5倍,整数运算性能为至强7400的1.7倍,浮点运算性能则是至强7400的2.2倍,实现英特尔多路服务器处理器两代产品间前所未有的性能飞跃。
至强7500对八路服务器市场会带来什么样的影响?
得益于至强7500处理器中的四条高带宽快速通道互联(QPI)链接,今天服务器厂商可以非常容易地通过QPI构建出一套八路系统出来,有些厂商还可以通过自身的节点控制器技术扩展到32路。预计至强7500发布时全球会有8个OEM厂商推出15款八路和八路以上的系统。2007年,8路以上的IA架构服务器还只有IBM、NEC和Unisys在提供,而到了今年,这一阵营将扩大到十来家,除了上述三家,还包括SGI、惠普、富士通、浪潮、布尔、Sun等。因此,过去,由于八路服务器的设计和制造困难,售价往往比普通四路服务器高出几倍,技术也只掌握在少数几个厂商手中,从而限制了八路系统的需求。而随着至强7500的到来,预计未来八路与四路的售价比例的格局会被打破。
8路Nehalem-EX平台,128个线程,最多128个DIMM,内存容量可达1TB
值得注意的是,在构建八路以上服务器系统时,至强7500仍然给服务器厂商提供了较大的创新空间,各厂商可以根据自身能力和市场策略来选择。主要体现在两个方面:一是在架构创新方面,可以直接使用QPI来连接构建一个成本适中的八路系统,也有的厂商使用自己的节点控制器,用到的协议和最终效率都会不同。二是虽然至强7500提供了二三十个RAS功能,但并不是所有厂商都需要或者有能力去实现这些功能,比如硬件分区、CPU热添加/热删除、内存板的热添加/热删除,不同厂商会有各自的考虑。
Nehalem-EX/至强7500在RAS特性方面能否与RSIC小型机抗衡?
和双路平台不同,多路平台不仅要求更高的性能,也要有更强的稳定性。一直以来,X86服务器在同RISC小型机竞争时,在RAS(Reliability可靠性、Availability 可用性和Serviceability可服务性)方面往往处于下风,这也是一些关键领域的小型机用户迟迟不敢向X86/Linux开放平台迁移的重要原因之一。
Nehalem-EX的出现,将X86系统的RAS特性提高到了一个全新的水平,这些技术多达22条,集中解决三个方面的问题:一是数据保护,可以诊断哪些数据出错,利用CRC、ECC校验来纠正错误,如果不能纠正,可以把这些坏的数据进行隔离,以保证不影响其他数据,避免系统的重启和宕机。二是高可用设计,包括QPI Link之间的互备和热切换,内存和CPU的热切换、故障预警机制等等,以保证系统的高可用。三是降低系统计划内的宕机时间,包括系统分区管理技术、CPU和内存的热添加和热移除等。具体如下表所示:
Nehalem-EX处理器的22项RAS特性 | ||
方面 | 功能 | 技术 |
数据保护 | l 减少关键级的错误 l 全系统数据错误检测 l 限制错误所产生的影响 | 1. Parity checking and ECC 寄偶检验与ECC |
2. Memory Themal Throttling 内存热量分流 | ||
3. Memory demand & patrol scrubbing 内存需求与巡视清除 | ||
4. Corrupt data containment 计算数据防泄漏 | ||
5. QPI viral mode QPI防病毒模式 | ||
6. QPI rolling CRC QPI卷动CRC检验 | ||
高可用 | l 恢复失效的数据连接 l 从失效的CPU与内存上迁移工作负载 l 从无法修正的错误中恢复 l 帮助进行故障预测 | 1. Intel SMI Lane Failover 内存控制器(SMI)通道容错 |
2. Intel SMI Clock Fail Over 内存控制器时钟容错 | ||
3. Intel SMI & QPI Packet Retry 内存控制器与QPI包重试 | ||
4. QPI Clock Fail Over QPI时钟容错 | ||
5. QPI Self-Healing QPI自我修复 | ||
6. SDDC plus random bit error recovery 单设备失效代码与随机位错误恢复 | ||
7. Memory Mirroring 内存镜像 | ||
8. Memory DIMM and Rank Spaning 内存DIMM与列(RANK)广度 | ||
9. Dynamic CPU and memory migration CPU与内存动态迁移 | ||
10. MCA-recovery with OS support 操作系统支持MCA恢复 | ||
减少计划内宕机时间 | l 维护模块化分区而非整个系统 l 预先替换将失效的组件 | 1. Static system partitioning 静态系统分区 |
2. MCA error logging(CMCI) with OS predictive failure analysis 基于操作系统预知失效分析的MAC错误记录 | ||
3. Physical Memory Board Hot Add/remove 物理内存卡热添加与移除 | ||
4. Dynamic/OS Memory On-lining(capacity change) 动态/OS内存在线(容量变更) | ||
5. Physical CPU Board Hot Add/remove 物理CPU卡添加/移除 | ||
6. OS CPU on-lining(capacity change)OS处理器在线(容量变更) |
这里特别值得一提的就是,Nehalem-EX增加了原来只在安腾处理器上才有的MCA(Machine Check Architecture)机器校验恢复功能。这个功能可以在不关机的情况下检查和纠正处理器、内存或者IO中的错误,这对于虚拟化环境非常重要。在虚拟化环境中,要关机查找和修复故障意味着必须迁移所有的虚拟机,如采用机器检查恢复功能,这个故障可以隔离,不必迁移所有的虚拟机。目前,包括微软Windows Server、Redhat、SuseLinux以及VMware都已经支持这一功能。
可以说,Nehalem-EX已经拥有X86系统里较高级别的RAS特性,而且与小型机相比,差距也已经不大。但需要注意的是,这些RAS特性的最终实现需要系统厂商和软件厂商的支持。目前,在操作系统和虚拟化方面,Novell、Redhat、微软和VMware都已经做好准备,为至强7500中的高级RAS特性提供支持,以保证可以将这些功能提供给上层的应用软件使用。另一方面,虽然至强7500提供了20多个RAS功能,但并不是所有服务器厂商都需要或者有能力去实现这些功能,比如硬件分区、CPU热添加/热删除、内存板的热添加/热移除,不同厂商会有各自的考虑。这些都需要用户在方案选型时加以考虑。
随着Nehalem-EX往高端走,与英特尔的非X86平台安腾(Tukwila)系列如何区隔?
在性能、可靠性和扩展性方面,至强7500和安腾都具备在关键业务计算领域内的能力,两者的关键不同在于客户对操作系统和可用应用软件的选择,甚至包含对OEM厂商的选择。用户可以从这三个方面来选择安腾或者至强7500,比如要用HP-UX或者一些大机操作系统的用户,当然选安腾,而对于Windows和LINUX应用则推荐至强7500。另外,虽然Nehalem-EX中引入了原来安腾上才有的MCA功能,但还有一些RAS特性是至强所没有的,比如智能锁步的功能。