【IT168评测中心】前段时间我们测试了Nehalem-EX(至强7500系列和6500系列)处理器的数据库性能表现,从结果来看,应该是受到了网卡的限制。Nehalem-EX是一个最高8核的基于Nehalem架构的面向多路服务器的处理器,其下一代Westmere-EX也已经浮出水面,最高将会达到10核(也就是20个线程)。不过Westmere-EX看来今年内是无法到达我们手中了。
四路Nehalem-EX刀片服务器:DELL PowerEdge M910
虽然我们猜测测试中的问题在于网络接口,可是我们也没机会验证,因为样机DELL PowerEdge M910是一个基于四路Nehalem-EX的、全高的DELL刀片服务器,无法使用我们手中的多块网卡,它只能使用它自有的模块。下面我们先来看看我们对Nehalem-EX/PE M910进行的关闭超线程进行的数据库性能测试。
测试环境和测试方法一如既往……
网络实验室控制台
网络实验室机房
Cisco Catalyst 4506千兆交换机,120个千兆铜口
部分Dell PowerEdge SC430服务器
测试平台、测试环境 | ||||
测试分组 | ||||
类别 | 四路Intel Nehalem-EX Xeon E7540 | |||
处理器子系统 | ||||
处理器 | 四路Intel Xeon E7540 | |||
处理器架构 | Intel 45nm Nehalem-EX | |||
处理器代号 | Beckton (Nehalem-EX) | |||
处理器封装 | Socket 1567 LGA | |||
处理器规格 | 六核 | |||
处理器指令集 | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,SSE4.2,EM64T,VT | |||
主频 | 2.0GHz | |||
Turbo Boost主频 (多核) | 2.00GHz(+0MHz) | |||
Turbo Boost 主频 (单/双核) | 2.26GHz(+266MHz) | |||
处理器外部总线 | 4x QPI 3200MHz 6.40GT/s 单向12.8GB/s(每QPI) 双向25.6GB/s(每QPI) | |||
L1 D-Cache | 6x 32KB 8路集合关联 | |||
L1 I-Cache | 6x 32KB 4路集合关联 | |||
L2 Cache | 6x 256KB 8路集合关联 | |||
L3 Cache | 18MB 24路集合关联 | |||
主板 | ||||
主板型号 | DELL PE M910 | |||
芯片组 | Intel Boxboro IOH:Intel 7500(Boxboro) ICH:Intel 82801JR(ICH10R) | |||
芯片特性 | 2x QPI 36 PCI Express Gen2 Lanes VT-d Gen 2 | |||
内存控制器 | 每CPU集成两个SMI 主板实现一个SMI 每SMI两个SMB 四通道R-ECC DDR3 1066 | |||
内存 | 4GB R-ECC DDR3 1066 SDRAM x16 | |||
网络子系统 | ||||
网卡 | Broadcom BCM5709S Dual Port GbE x2 8x RSS Queue MSI | |||
软件环境 | ||||
操作系统 | Microsoft Windows Server 2008 R2 Datacenter Edition |
我们在BIOS中关闭了超线程技术,在DELL M910服务器中,这个选项叫Logical Processor。
Nehalem-EX Xeon E7540处理器,搭配的芯片组叫做Boxboro,也叫7500系列芯片组
Nehalem-EX:Xeon X7540,不是最高端型号,只具有6个核心
解读:4P24C48T指的是4处理器(Processors)、24核心(Cores)、48线程(Threads)。依此类推。
三角形结点的就是关闭超线程的M910
结果比之前开启超线程的都要高,达到了13万Tps,此时使用任务管理器看CPU负载已经达到了100%,这应该确实是M910的真实性能了。当然,CPU占用显示为100%并不一定就意味着机器已经达到了极限,它只能作为一个参考。
双Broadcom BCM5709S双口千兆网卡,支持8个RSS队列
问题可能出现在两个方面:网卡和系统SMP处理上。有可能目前的BCM5709S网卡驱动无法很好地利用多核,导致关闭超线程下性能还更高一些。也有可能是硬件+系统软件的对超线程的支持有些问题,Windows Server 2008 R2的内核以及网络堆栈在这方面是没有问题的,问题可能出现在早期的主板BIOS上。在多个软件的测试中笔者碰到了只能利用到32个逻辑处理器的情况(打开超线程下M910会具有48个逻辑处理器),这可能是一个问题。
【IT168评测中心】笔者对Nehalem-EX平台寄予了厚望,这是因为它具有新的内部拓扑结构:一个环形总线将所有核心/L3缓存块以及外部IO连接了起来。然而这个结构对目前的Nehalem-EX来说未能完全体现出性能上的优势来,因为它们的频率比较低一些,预计其下一代10核心、频率也更高的Westmere-EX处理器才会是真正展现实力的时候。
通过测试,笔者发现关闭超线程下得到的成绩还高一些,达到了13万TPS,笔者也希望能将Nehalem-EX真正的性能展现出来。不日Intel官方的Nehalem-EX样机将会到达我们评测中心,预计这个配置更高、更完全的机器将会有带给我们更接近真实的表现,敬请期待。