【IT168评测中心】在3月底,Intel(英特尔)发布了45nm、8核心的Nehalem架构处理器:Nehalem-EX,也就是至强7500系列处理器,面向多路服务器平台,主要目的是提供极强的计算能力、内存扩充能力以及RAS特性。足够多的RAS特性对于Mission Critical领域是十分重要的,因为这个领域上,稳定性非常重要。
45nm八核心:Intel Nehalem-EX/至强7500系列处理器
稍后的4月份,DELL发布了基于Nehalem-EX处理器的多款产品,有M810、M910、R910等数个型号,各有特点,我们收到了其中的M910——全称是PowerEdge M910,熟悉DELL服务器产品线的话,可以根据M这个字母知道这是一个刀片服务器:
四路Nehalem-EX刀片服务器:DELL PowerEdge M910
M910是一个基于四路Nehalem-EX的、全高的DELL刀片服务器,它也被设计成可以在二路下工作(使用的可以是7500或者6500系列处理器),这时,M910提供了一个叫做FlexMemory Bridge的技术,让它在二路时也能使用在四路配置下的所有内存,实际上,这是一种在另外的CPU插槽上增加一个SMI(Scalable Memory Interconnect,可扩展内存互联)转接桥的方案。这个方案会影响到其性能,不过这一点以后再谈,下面我们先来看看我们对Nehalem-EX/PE M910进行的数据库性能测试。
一般而言,数据库在大型IT架构中处于后端部分,通常的Web服务器处于前端部分。Web服务器通过调用来获取数据库上的信息。
在2009年秋我们IT168评测中心网络实验室搬迁到新的机房之后,我们又对实验室的服务器测试平台进行了大幅度的升级,先是将已有的Cisco Catalyst 4506千兆交换机升级到3个模块,达到了一共120个千兆网络端口,还新购买了30台DELL PowerEdge T100服务器,配合原有的30台DELL PowerEdge SC430服务器以及30台PC作为网络测试的客户端,可以提供非常充足的测试压力。
网络实验室控制台
网络实验室机房
Cisco Catalyst 4506千兆交换机,120个千兆铜口
部分Dell PowerEdge SC430服务器
同时,我们也对数据库服务器的测试环境进行了改进:
Benchmark Factory for Databases 5.7.1g
我们选择了Benchmark Factory for Databases 5.7.1g软件来进行测试,它是我们之前使用的4.6的升级版本。
我们选择了BF内置的标准测试脚本AS3AP,这项测试可用于对于ANSI结构化查询语言(SQL)关系型数据库进行测试,它可用于测试DBMS(单用户微机数据库管理系统),也可用于测试高性能并行或者分布式数据库。关系性数据库就是用二维表格结构来表示实体及实体之间联系模型的数据库形式。
BF通过一台独立的控制台控制我们的60台服务器充当的客户端产生数据库测试压力,由于客户端所有的资源都用来产生数据库操作,因此可以给服务器施加相当大的测试压力。
Benchmark Factory 运行报告
我们选择了BF内置的标准测试脚本AS3AP,这项测试可用于对于ANSI结构化查询语言(SQL)关系型数据库进行测试,它可用于测试DBMS(单用户微机数据库管理系统),也可用于测试高性能并行或者分布式数据库。关系性数据库就是用二维表格结构来表示实体及实体之间联系模型的数据库形式。
最后,我们使用的是SQL Server 2005 x64个版本
测试平台、测试环境 | ||||||
测试分组 | ||||||
类别 | 双路Intel Nehalem-EP Xeon X5570 | 双路Intel Westmere-EP Xeon X5670 | 四路Intel Nehalem-EX Xeon E7540 | |||
处理器子系统 | ||||||
处理器 | 双路Intel Xeon X5570 | 双路Intel Xeon X5670 | 四路Intel Xeon E7540 | |||
处理器架构 | Intel 45nm Nehalem | Intel 32nm Westmere-EP | Intel 45nm Nehalem-EX | |||
处理器代号 | Gainestown (Nehalem-EP) | ? (Westmere-EP) | Beckton (Nehalem-EX) | |||
处理器封装 | Socket 1366 LGA | Socket 1366 LGA | Socket 1567 LGA | |||
处理器规格 | 四核 | 六核 | 六核 | |||
处理器指令集 | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,SSE4.2,EM64T,VT | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,SSE4.2,EM64T,VT AES | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,SSE4.2,EM64T,VT | |||
主频 | 2.93GHz | 2.93GHz | 2.0GHz | |||
Turbo Boost主频 (多核) | 3.20GHz(+266MHz) | 3.20GHz(+266MHz) | 2.00GHz(+0MHz) | |||
Turbo Boost 主频 (单/双核) | 3.333GHz(+400MHz) | 3.333GHz(+400MHz) | 2.26GHz(+266MHz) | |||
处理器外部总线 | 2x QPI 3200MHz 6.40GT/s 单向12.8GB/s(每QPI) 双向25.6GB/s(每QPI) | 2x QPI 3200MHz 6.40GT/s 单向12.8GB/s(每QPI) 双向25.6GB/s(每QPI) | 4x QPI 3200MHz 6.40GT/s 单向12.8GB/s(每QPI) 双向25.6GB/s(每QPI) | |||
L1 D-Cache | 4x 32KB 8路集合关联 | 6x 32KB 8路集合关联 | 6x 32KB 8路集合关联 | |||
L1 I-Cache | 4x 32KB 4路集合关联 | 6x 32KB 4路集合关联 | 6x 32KB 4路集合关联 | |||
L2 Cache | 4x 256KB 8路集合关联 | 6x 256KB 8路集合关联 | 6x 256KB 8路集合关联 | |||
L3 Cache | 8MB @ 2668.7MHz 16路集合关联 | 12MB @ 2668.7MHz 16路集合关联 | 18MB 24路集合关联 | |||
主板 | ||||||
主板型号 | ASUS Z8PS-D12-1U | ASUS Z8PS-D12-1U | DELL PE M910 | |||
芯片组 | Intel Tylersburg-EP IOH:Intel 5520(Tylersburg-36D) ICH:Intel 82801JR(ICH10R) | Intel Tylersburg-EP IOH:Intel 5520(Tylersburg-36D) ICH:Intel 82801JR(ICH10R) | Intel Boxboro IOH:Intel 7500(Boxboro) ICH:Intel 82801JR(ICH10R) | |||
芯片特性 | 2x QPI 36 PCI Express Gen2 Lanes VT-d Gen 2 | 2x QPI 36 PCI Express Gen2 Lanes VT-d Gen 2 | 2x QPI 36 PCI Express Gen2 Lanes VT-d Gen 2 | |||
内存控制器 | 每CPU集成三通道R-ECC DDR3 1333 | 每CPU集成三通道R-ECC DDR3 1333 | 每CPU集成两个SMI 主板实现一个SMI 每SMI两个SMB 四通道R-ECC DDR3 1066 | |||
内存 | 4GB R-ECC DDR3 1333 SDRAM x6 | 4GB R-ECC DDR3 1333 SDRAM x6 | 4GB R-ECC DDR3 1066 SDRAM x16 | |||
网络子系统 | ||||||
网卡 | Intel 82576 Dual Port GbE x2 8x RSS Queue MSI | Intel 82576 Dual Port GbE x2 8x RSS Queue MSI | Broadcom BCM5709S Dual Port GbE x2(使用其中两个端口) 8x RSS Queue MSI | |||
软件环境 | ||||||
操作系统 | Microsoft Windows Server 2008 R2 Datacenter Edition | Microsoft Windows Server 2008 R2 Datacenter Edition | Microsoft Windows Server 2008 R2 Datacenter Edition |
需要注意的一点是,Xeon E7540处理器具有Turbo Boost(睿频)技术,不过,经过测试,在所有核心都满负载的时候,它的提升幅度为0。
Nehalem-EX Xeon E7540处理器,搭配的芯片组叫做Boxboro,也叫7500系列芯片组
Nehalem-EX:Xeon X7540,不是最高端型号,只具有6个核心
Nehalem-EX E7540,6核心,主频2.00GHz
18MB、24路集合关联的L3是Nehalem-EX区别于普通Nehalem的地方
解读:w/HTT的意思是with HTT,也就是“在超线程状态下”,w/o HTT意思是without HTT,也就是“不在超线程状态下”,TB则是Turbo Boost睿频技术,4P24C48T指的是4处理器(Processors)、24核心(Cores)、48线程(Threads)。依此类推。
结果是12万Tps左右,不过,此时PowerEdge M910的负载只有50%左右,因为它只使用了两个千兆网络端口,这限制了其性能。对比的样机都使用了一个四口的千兆网卡,并且两个测试平台的网卡也不相同。由于M910是个刀片服务器,无法使用通用的网卡。我们正在联系DELL更新网络子系统。
对比平台的四口Intel 82576EB网卡,支持8个RSS队列
Nehalem-EX/DELL PE M910使用的Broadcom网络芯片,型号BCM5709C,是个支持8个RSS队列的双口千兆网卡,M910总共提供了4个千兆网口,不过测试的时候只能使用其中两个,因为另外两个端口被分配到刀片机箱的另外一个交换机上去了
【IT168评测中心】我们抢先测试了在3月底发布的Nehalem-EX处理器实物,基于DELL的M1000e刀片机架和PowerEdge M910刀片服务器,我们收到的服务器配置并不高:Xeon E7540,这是一个2.0GHz主频、六个核心的Nehalem-EX处理器。比起来,对比机器使用的32nm Westmere-EP Xeon X5670,同样是六核配置,主频则达到了2.93GHz,实际工作频率可以达到3.20/3.33GHz,显然在单处理器上,我们的Nehalem-EX测试平台其实不占优势。
8核心Nehalem-EX晶圆图
DELL PowerEdge M910
另外一个因素是网络接口,在我们的测试当中,M910的数据库性能在12万TPS左右,远比不上对比的Nehalem-EP/Westmere-EP,因为M910平台使用的是两个BCM5709S网络端口,而对比平台使用的是四个82576EB端口。根据以前的测试,使用两个82574L端口的双X5570平台达到的SQL 2005 TPS是9万左右。我们相信Nehalem-EX还有更高的潜力,因为测试的时候其CPU负荷还不高,我们正在联系协调更换M910的配置,请继续期待。