服务器 频道

入门也疯狂 联想T260 G2塔式服务器评测

  【IT168评测中心】2003年,联想公司宣布其英文标识从Legend更换为Lenovo,其中Le取自原标识Legend,代表着秉承其一贯传统,新增加的novo取自拉丁词“新”,代表着联想的核心是创新精神。2004年,联想公司正式从Legend更名为Lenovo。

 
联想万全T260 G2服务器

  联想(Lenovo)是国内主要的服务器厂商之一,其第一台服务器早在1995年就出现了。联想的服务器系列以万全为名。我们收到的万全T260 G2是其推出的采用最新一代Nehalem-EP/Xeon 5500系列处理器的服务器产品,我们以前测试的服务器基本都是机架式服务器,和它们不同,T260 G2是一台塔式服务器。T260的T或许是Tower(塔式)的意思。

联想T260 G2服务器 

  塔式服务器的体积相对比较大,散热会比较好——不考虑机架式惯用的暴力散热风扇的话,因此相对而言塔式服务器的计算密度会低一些,不太适合机房使用。不过,塔式服务器不需要机架就可以使用,因此用于小型的企业会更适合,从定位来看,T260 G2应该是面向小型工作组应用,我们收到的样机配置的是单路Xeon E5504,主频2.0GHz。

Intel Nehalem-EP处理器首发深度评测

直联架构的威力 Nehalem-EP处理器解析

Nehalem-EP 新Xeon 5500处理器首度曝光

透视六核心至强 Dunnington处理器解析

透视八核心至强 Nehalem-EX处理器解析

2008年度评测报告:深入Nehalem微架构

性能大幅提升 Core i7 服务器应用测试

再攀性能之巅 Intel全新酷睿i7深度评测

机密揭露:Intel超线程技术有多少种?

[IDF08]基辛格演讲:Nehalem集群演示

 


联想万全T260 G2塔式服务器

 


黝黑的外观

 


俩5.25"外置扩展槽、一3.25"外置扩展槽、俩前置USB

 


主板背板很简洁

内部空间比较充足,一般的服务器主板都是EATX(Extended ATX)结构,比标准的ATX主板要长一些,因此服务器机箱也通常要长一点

 


大功率电源,+12V合并输出43A

大尺寸后机箱风扇

 


硬盘“笼”,它只是一个存放硬盘的地方,没有热插拔等和背板功能

 

 


多个硬盘长时间工作必须配置主动散热手段

 

 


使用的是Hitachi Deskstar P7K500硬盘

 


转速7200RPM,容量250GB,缓存8MB

 


SATA硬盘,性能一般,适用于负荷不高的情况

 


SATA 3Gb/s

 


Xeon E5504处理器,Nehalem架构,主频2.0GHz,QPI频率4.8GT/s,缓存4MB,四核心不带超线程技术和Turbo Boost技术

 


原配的1GB单条内存,为了符合测试的需要,我们使用了另外的4条2GB内存

 


为什么另外使用的是4条内存呢?虽然Nehalem-EP系列处理器全线支持三通道内存,然而T260 G2服务器使用的主板只提供了双通道的支持,这限制了T260 G2的性能范围

T260 G2使用的主板芯片组是Tylersburg-24D,型号为5500,提供了24条PCIE Lanes,它们是怎么分布的呢?
 

如图,主板最上的三条PCIE全部是由Tylersburg-24D提供的,不过速率不同,其中一条是x4,另两条是x8,除此之外,千兆网卡还额外使用了两条PCIE Lanes

PCIE x1界面的I82574L千兆网卡芯片,一共有两个,直接与Tylersburg相连让其性能得到保证,比起挂在ICH10R上来要更快一些
 

ICH10R南桥芯片——正式说法叫做ICH,提供了6条PCIE 1.0 Lanes和PCI及其他若干低速设备接口,在上面插槽图中,最下方的短PCIE插槽就是ICH10R提供的PCIE x4接口
 

除了插槽使用了4条PCIE Lane之外,这个ServerEngines芯片也使用了一条PCIE Lane,它内部集成了Matrox G200e显示内核,实际上就是一块显卡

  在2005年度服务器横评之后,我们认为当时的网络实验室无法满足今后继续发展的服务器测试的需要。所以,2006年我们IT168评测中心又斥资几十万对于IT168网络实验室的服务器测试平台进行了大幅度的升级,为思科Catalyst4500千兆交换机(WS-X4013+ Supervisor Engine II-Plus和WS-X4548-GB-RJ45)增加了一个思科全千兆24口模块WS-X4424-GB-RJ45,可同时连接72个千兆铜缆设备和2个光缆设备。另外,我们还购置了29台Dell PowerEdge SC430塔式服务器和原来的32台主流配置PC一起为服务器测试平台的提供负载。2007年,我们又采购性能更强的部分客户端,来确保为新一代的服务器提供足够的测试负载。2009年初,我们又对所有客户端的内存子系统进行了全面的升级。


Catalyst4500千兆交换机


部分Dell PowerEdge SC430服务器

  在新的测试环境下,我们进一步完善了服务器性能测试方案:

  • SPEC CPU 2006 v1.0.1

  SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。

  SPEC CPU 2006是SPEC组织推出的CPU子系统评估软件最新版,我们之前使用的是SPEC CPU 2000。和上一个版本一样,SPEC CPU 2006包括了CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能,SPEC CPU 2006中对SPEC CPU 2000中的一些测试进行了升级,并抛弃/加入了一些测试,因此两个版本测试得分并没有可比较性。

  SPEC CPU测试中,测试系统的处理器、内存子系统和使用到的编译器(SPEC CPU提供的是源代码,并且允许测试用户进行一定的编译优化)都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2006的影响非常的小。

  SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。

  我们在被测服务器中安装了当前最新版本的Intel C++ 10.1.025 Compiler、Intel Fortran 10.1.025 Compiler这两款SPEC CPU 2006必需的编译器,通过最新出现的QxS编译参数,Intel Compiler 10版本开始支持对Intel SSE4指令集进行优化(假如只支持SSE3,则使用QxT编译参数)。我们另外安装了Microsoft Visual Studio 2003 SP1提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,使用了较多的编译选项。我们根据被测系统选择实际可同时处理的线程数量,最后得到SPEC rate base测试结果(基于base标准编译,SPEC base rate测试代表系统同时处理多个任务的能力)。

  和其它测试部件不同,SPEC CPU 2006需要大量的系统物理内存,我们的SPEC测试在64bit Windows Server 2008 Enterprise下完成,对于每个运算核心,最低配置1.5GB内存。

  • SiSoftware Sandra v2009

  SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。从2007开始,Sandra的Arithmetic benchmarks增加了对SSE3 & SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台,这也是我们选择这款软件的原因之一。

  • CineBench R10

  CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,在服务器测试平台中显示子系统不重要,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。

  • ScienceMark 2.0

  ScienceMark 2.0可以用来评估测试对象在执行科学计算时的运算效能,这部分效能主要和处理器子系统和内存子系统相关。我们主要用来评估测试对象的内存子系统的性能。

  • Iometer 2006.7.27

  Iometer是一款功能非常强大的IO测试软件,它除了可以在本机运行测试本机的IO(磁盘)性能之外,还提供了模拟网络应用的能力。在这次的测试中,我们仅仅让它在本机运行测试服务器的磁盘性能。为了全面测试被测服务器的IO性能,我们分别选择了不同的测试脚本。

  • Max_throughput(read):文件尺寸为64KB,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取吞吐量

  • Max_IO(read):文件尺寸为512B,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取操作IO处理能力

  • Max_throughput(write):文件尺寸为64KB,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入吞吐量

  • Max_IO(write):文件尺寸为512B,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入操作IO处理能力

  •  Benchmark Factory 4.6

  大部分的服务器应用都同数据库有着密切的联系,因此我们今年开始着手在在服务器测试中加入对于数据库性能的测试。我们选择了Benchmark Factory 4.6软件和Microsoft SQL2005 SP3来测试不同的硬件平台在数据库应用中的表现。

  我们选择了Benchmark Factory内置的标准测试脚本AS3AP,这项测试可用于对于ANSI结构化查询语言(SQL)关系型数据库进行测试,它可用于测试DBMS(单用户微机数据库管理系统),也可用于测试高性能并行或者分布式数据库。

  • NetBench v7.03

  NetBench是针对文件服务器的性能测试软件,影响NetBench性能的主要是服务器的磁盘子系统,服务器磁盘控制器、条带大小、读写缓存、硬盘类型、组建磁盘阵列模式、内存容量、网络拓朴结构等都会对测试结果有明显的影响。我们在被测服务器上设立了文件服务器,NetBench通过网络实验室中60个客户端来模拟网络中的PC向文件服务器所发出的文件传输请求,文件服务器则将存储在磁盘上的文件数据发送给相应的客户端。在测试过程中,客户端会以每四台一组的步进依次增加并且向服务器发送文件传输请求,测试结束后控制台收集数据并绘制出服务器的数据传输变化曲线。

  • 系统功耗监测

  我们使用UNI-T UT71E智能数字万用表对于被测服务器系统的整体功耗进行了监测,利用随机附带的接口程序,我们可以记录被测服务器任意时间段内的功率变化。

 

 
我们收到的样机配置的是单个Xeon E5504处理器,属于Nehalem-EP系列,不过,和我们测过的X5570、W5580不同,E5504处理器的规格有所缩减,它没有超线程技术,没有Turbo Boost技术——它的主频也比较低,为2GHz,QPI Link也较低:2.4GHz,并且只支持R-ECC DDR3-800内存,硬件上还不同的一点是,它的L3缓存是4MB,而不是常见的8MB

 
 T260 G2样机只配置一个处理器

 

 

 

主板只支持双通道内存,此外,CPU的内置内存控制器仅支持到DDR3 800


Tylersburg-24D型号为5500,Tylersburg-36D则为5520
 
四条运行在DDR2 800的2GB R-ECC DDR3-1066内存
 

现在能买到的ICH10R都是A0步进

 

测试平台、测试环境
测试分组
类别Lenovo T260 G2
单路Intel Gainestown
Xeon E5504
DELL PE 2900 III基准
双路Intel Harpertown
Xeon E5430
处理器子系统
处理器单路Intel Xeon E5504双路Intel Xeon E5430
处理器架构Intel 45nm NehalemIntel 45nm Penryn
处理器代号GainestownHarpertown
处理器封装Socket 1366 LGASocke 771 LGA
处理器规格四核四核
处理器指令集MMX,SSE,SSE2,SSE3,SSSE3,
SSE4.1,SSE4.2,EM64T,VT
MMX,SSE,SSE2,SSE3,SSSE3,
SSE4.1,EM64T,VT
主频2.00GHz2.66GHz
处理器外部总线2x QPI
2400MHz
4.8GT/s
单向9.6GB/s(每QPI)
双向19.2GB/s(每QPI)
FSB
333MHz
1333MT/s
10.6GB/s
L1 D-Cache4x 32KB
8路集合关联
4x 32KB
8路集合关联
L1 I-Cache4x 32KB
4路集合关联
4x 32KB
8路集合关联
L2 Cache4x 256KB
8路集合关联
2x 6144KB
16路集合关联
L3 Cache4MB @ 1600MHz
16路集合关联
 
主板
主板型号Intel S5500BCDELL PE 2900 III
芯片组Intel Tylersburg-EP
IOH:Intel 5500(Tylersburg-24D)
ICH:Intel 82801JR(ICH10R)
MCH:Intel 5000X
ICH:Intel ESB6321
芯片特性2x QPI
24 PCI Express Gen2 Lanes
VT-d Gen 2
2x FSB1333
PCI Express Gen1 Lanes
12MB Snoop Filter
VT-d Gen 1
内存控制器每CPU集成三通道R-ECC DDR3 800
主板实现双通道
北桥集成四通道FBD DDR2 667
内存2GB ECC DDR3 800 SDRAM x42GB FBD DDR2 667 SDRAM x4
系统磁盘子系统
磁盘控制器Intel ICH10R SATA AHCI ControllerDELL Perc 5/i RAID Controller
磁盘控制器规格6x SATA 3Gb/s
AHCI w/NCQ

Intel IOP333
500MHz Intel Xscale(ARM)
256MB ECC DDR2 RAM
LSI 1068E SAS
8x SAS 3Gb/s
RAID 0/1/3/5
PCI Express x8

磁盘控制器设置AHCI w/NCQRAID 5
磁盘控制器驱动IMSM
8.8.0.1006
LSI MegaRAID R3.6
3.9.0.64
磁盘Hitachi
Deskstar P7K500
HDP725025GLA380
Seagate
Cheetah 15K.5
ST314655SS x3
磁盘规格7200RPM
250GB
SATA 3Gb/s w/NCQ
8MB Cache
15000RPM
146GB
SAS 3Gb/s
16MB Cache
磁盘设置SATA 3Gb/s w/NCQ
50GB系统分区
SAS 3Gb/s
20GB系统分区
网络子系统
网卡Intel 82574L Gigabit Network Controller x2Broadcom BCM5708C
PCI-E千兆网卡 x2
网卡设置PCI Express x1 @ ICH10R
Intel NIC Teaming
Load Balancing
PCI Express x1 @ ESB6321
Broadcom NIC Teaming
Load Balancing
网卡驱动Intel PRO Set 14.0Broadcom NetXtreme 2
11.04.01
软件环境
操作系统Microsoft
Windows Server 2008 Enterprise Edition SP1 x64
Microsoft
Windows Server 2008 Enterprise Edition SP1 x64

 

  这个测试配置可说是我们测过的Nehalem-EP处理器最低端的配置:单路处理器、双通道内存。可见T260 G2服务器面向的定位是小型工作组,它的价格也是很低的。

  SPEC CPU 2006整数运算主要包含编译、压缩、人工智能、视频压缩转换、XML处理等,此外,各种日常操作也主要是基于整数操作。SPEC CPU 2006的整数运算包含了400.perlbench PERL编程语言、401.bzip2 压缩、403.gcc C编译器、429.mcf 组合优化、445.gobmk 人工智能:围棋、456.hmmer 基因序列搜索、458.sjeng 人工智能:国际象棋、462.libquantum 物理:量子计算、464.h264ref 视频压缩、471.omnetpp 离散事件仿真、473.astar 寻路算法、483.xalancbmk XML处理共12项。

SPEC CPU 2006整数运算性能

  单路的情况下确实和双路基准平台有些距离。我们之前测试过双路E5504的情况,比基准平台略好。在测试中,少数项目是比基准平台性能更好的,如462.libquantum这样的项目,这是因为Nehalem-EP在单路、无超线程技术的情况下仍然具有内置内存控制器这一优势。

  SPEC CPU 2006的浮点运算测试包括的全部都是科学运算,科学运算需要用到大量的高精度浮点数据,如410.bwaves 流体力学、416.gamess 量子化学、433.milc 量子力学、434.zeusmp 物理:计算流体力学、435.gromacs 生物化学/分子力学、436.cactusADM 物理:广义相对论、437.leslie3d 流体力学、444.namd 生物/分子、447.dealII 有限元分析、450.soplex 线形编程、优化、453.povray 影像光线追踪、454.calculix 结构力学、459.GemsFDTD 计算电磁学、465.tonto 量子化学、470.lbm 流体力学、481.wrf 天气预报、482.sphinx3 语音识别共17项测试。

SPEC CPU 2006浮点运算性能

   浮点的情况也类似,双拳难敌四手,四核难敌八核……和前面一样,一些项目上单路E5504也能比双路E5430更强,并且非常明显,如410.bwaves流体力学这样的项目,这表现了内置内存控制器的优势。

  SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,它可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。我们利用了其中多个性能测试模块对于被测系统的性能进行了快速的测试。

  有一点需要说明的是,Sandra的处理器架构性能测试是根据处理器所能支持的所有指令集中选择进行的,不同的处理器支持的指令集不同,测试使用到的指令集也就不同。例如,Nehalem在这个测试当中就可以使用SSE4.2,而Penryn就只能使用SSE4.1,而用Opteron可能就只能到SSE3了。一般而言,由于可以使用SSE4,Intel的处理器理论性能会比较好。

SiSoftware Sandra Pro Business 2009
测试对象
Lenovo T260 G2
单路Intel Gainestown
Xeon E5504
2.0GHz
DELL PE2900 III
双路Intel Harpertown
Xeon E5430
2.66GHz
Processor Arithmetic Benchmark
处理器架构测试
Dhrystone ALU
49318MIPS91006MIPS
Dhrystone ALU vs SPEED
24.66MIPS/MHz34.21MIPS/MHz
Whetstone iSSE3
26064MFLOPS78385MFLOPS
Dhrystone iSSE3 vs SPEED
13.03MFLOPS/MHz29.47MFLOPS/MHz
Processor Multi-Media Benchmark
处理器多媒体测试
Multi-Media Int x16 iSSE4.1
84.83MPixel/s 
Multi-Media Int x8 iSSE4.1
 199.33MPixel/s
Multi-Media Int x16 iSSE4.1 vs SPEED
42.41kPixel/s/MHz 
Multi-Media Int x8 iSSE4.1 vs SPEED
 74.94kPixel/s/MHz
Multi-Media Float x8 iSSE2
64.72MPixel/s 
Multi-Media Float x4 iSSE2
 108.69MPixel/s
Multi-Media Float x8 iSSE2 vs SPEED
32.36kPixels/s/MHz 
Multi-Media Float x4 iSSE2 vs SPEED
 40.86kPixels/s/MHz
Multi-Media Double x4 iSSE2
33.81MPixel/s 
Multi-Media Double x2 iSSE2
 55.75MPixel/s
Multi-Media Double x4 iSSE2 vs SPEED
16.91kPixels/s/MHz 
Multi-Media Double x2 iSSE2 vs SPEED
 20.96kPixels/s/MHz
Multi-Core Efficiency Benchmark
Inter-Core Bandwidth
9.73GB/s20.54GB/s
Inter-Core Bandwidth vs SPEED
4.98MB/s/MHz7.91MB/s/MHz
Inter-Core Latency
(越小越好)
74ns90ns
Inter-Core Latency vs SPEED
(越小越好)
0.04ns/MHz0.03ns/MHz
Cryptography
加密性能测试
AES256 CPU Cryptographic Bandwidth
326MB/s 
AES256 CPU Cryptographic Bandwidth VS SPEED
0.16MB/s/MHz 
SHA256 CPU Hashing Bandwidth
373MB/s 
SHA256 CPU Hashing Bandwidth vs SPEED
0.19MB/s/MHz 
.NET Arithmetic Benchmark
.NET架构测试
Dhrystone .NET
8103MIPS10562MIPS
Dhrystone .NET vs SPEED
4.05MIPS/MHz3.97MIPS/MHz
Whetstone .NET
17394MFLOPS45399MFLOPS
Whetstone .NET vs SPEED
8.70MFLOPS/MHz17.07MFLOPS/MHz
.NET Multi-Media Benchmark
.NET多媒体测试
Multi-Media Int x1 .NET
17.02MPixel/s31.28MPixel/s
Multi-Media Int x1 .NET vs SPEED
8.51kPixels/s/MHz11.76kPixels/s/MHz
Multi-Media Float x1 .NET
4.99MPixel/s8.68MPixel/s
Multi-Media Float x1 .NET vs SPEED
2.49kPixels/s/MHz3.26kPixels/s/MHz
Multi-Media Double x1 .NET
9.28MPixel/s24.75MPixel/s
Multi-Media Double x1 .NET vs SPEED
4.64kPixels/s/MHz9.30kPixels/s/MHz

   和以前的测试项目我们又增加了一个Cryptography加密的测试。从结果来看,和SPEC CPU 2006测试比较相似,单路E5504(2.0GHz)只有双路E5430(2.66GHz)的50%~60%左右。

  SiSoftware Sandra缓存内存测试主要包括内存带宽、内存延迟等性能的测试。

SiSoftware Sandra Pro Business 2009
测试对象
Lenovo T260 G2
单路Intel Gainestown
Xeon E5504
2.0GHz
DELL PE2900 III
双路Intel Harpertown
Xeon E5430
2.66GHz
Memory Bandwidth Benchmark
内存带宽测试
Int Buff'd iSSE2 Memory Bandwidth
9.98GB/s6.13GB/s
Int Buff'd iSSE2 Memory Bandwidth vs SPEED
 9.43MB/s/MHz
Float Buff'd iSSE2 Memory Bandwidth
9.98GB/s6.13GB/s
Float Buff'd iSSE2 Memory Bandwidth vs SPEED
 9.43MB/s/MHz
Memory Latency Benchmark(Random)
内存延迟测试(随机)
Memory(Random Access) Latency
(越小越好)
108ns108ns
Speed Factor
(越小越好)
52.5095.20
Internal Data Cache
4clocks3clocks
L2 On-board Cache
10clocks18clocks
L3 On-board Cache
48clocks 
Memory Latency Benchmark(Linear)
内存延迟测试(线性)
Memory(Linear Access) Latency
(越小越好)
9ns20ns
Speed Factor
(越小越好)
4.4017.30
Internal Data Cache
4clocks3clocks
L2 On-board Cache
10clocks13clocks
L3 On-board Cache
12clocks 
Cache and Memory Benchmark
缓存及内存测试
Cache/Memory Bandwidth
36.81GB/s68.88GB/s
Cache/Memory Bandwidth vs SPEED
18.85MB/s/MHz26.52MB/s/MHz
Speed Factor
(越小越好)
33.40111.90
Internal Data Cache
163.13GB/s421.23GB/s
L2 On-board Cache
137.45GB/s122.68GB/s

SiSoftware Sandra对比

  由于内置内存控制器,因此单路E5504的表现也很好,只是在缓存方面受到了低主频的影响。E5504的L1、L2都和CPU主频一致,为2.0GHz,L3则比较独立,为1.6GHz。E5430的L1、L2都和CPU主频一样,即2.66GHz,E5430没有L3缓存。

  ScienceMark v2.0 Membench

  ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。

  首先我们进行的是ScienceMark的测试,主要考察系统的缓存和内存子系统情况。L1/L2 Cache的成绩主要是跟处理器频率相关,因为目前的处理器当中L1 Cache都是和处理器核心同频率的,而L2 Cache基本上也是——当前的处理器L2都是全速的(放置在处理器内但不在同一个芯片上的Pentium II为半速L2,而Pentium之前的处理器L2则和处理器分离,速度更低)。越快的频率,L1/L2性能就越好。而内存带宽主要由两部分相关:比较大的部分是内存架构,小部分是内存操作指令(集),例如使用最新的SSE指令集比通常的ALU指令集会得到更大的吞吐量,而不同的SSE版本性能也有不同。

ScienceMark Membench
厂商IntelIntel
产品型号Lenovo T260 G2
单路Intel Gainestown
Xeon E5504
PowerEdge 2900 III
Intel Harpertown
Xeon E5430 2.66GHz
内存技术参数2GB R-ECC DDR3-8 SDRAM x4
双通道
4GB R-ECC DDR3-1333 SDRAM x6
四通道
内存带宽(MB/s)8833.574485.09
Memory Latency(ns)
4 Bytes Stride4 cycles
2.00 ns
1.13 ns
16 Bytes Stride5 cycles
2.50 ns
4.89 ns
64 Bytes Stride17 cycles
8.50 ns
19.17 ns
256 Bytes Stride92 cycles
46.00 ns
59.77 ns
512 Bytes Stride104 cycles
52.00 ns
68.04 ns
Memory Algorithm Bandwidth(MB/s)
Compiler7918.043178.45
REP MOVSD8833.573220.23
ALU Reg Copy5631.162789.34
MMX Reg Copy5880.522972.91
MMX Reg 3dNow--
MMX Reg SSE8398.253978.53
SSE PAlign8750.744128.59
SSE PAlign SSE8715.174390.48
SSE2 PAlign8749.694326.42
SSE2 PAlign SSE8724.844441.71
MMX Block 4kb7648.234063.30
MMX Block 16kb8515.204479.88
SSE Block 4kb7731.284074.79
SSE Block 16kb68620.844485.09

  从多次测试来看,ScienceMark Membench和采用的处理器的个数没有太大的关系,在内置内存控制器的架构前提下,尽管只是双通道DDR3 800(理论带宽12.8GB/s),性能也比四通道DDR2 667(理论带宽21.3GB/s)要好。

  CineBench R10

  CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。

 

CineBench R10 64bit
处理器Lenovo T260 G2
单路Intel Gainestown
Xeon E5504
双路Intel Harpertown
Xeon E5430
显卡--
CPU Benchmark
Rendering (1 CPU)2868 CB-CPU2931 CB-CPU
Rendering (x CPU)10559 CB-CPU16806 CB-CPU
Multiprocessor Speedup3.68x5.73x
OpenGL Benchmark
OpenGL Standard158 CB-GFX176 CB-GFX

服务器测试成绩

  在单处理器渲染测试上,Xeon E5504略不及E5430,在多处理器渲染上,由于核心数目相差明显,因此也比不上基准平台。

  Iometer 2006.07.27

  我们的Iometer测试主要用来帮助诊断系统的磁盘子系统。被测试服务器采用了单块7200RPM SATA硬盘,这是一种低成本的配置方法,适合入门级别的服务器应用。

IO读

IO写

读吞吐量

写吞吐量

  可以预见,单7200RPM SATA的性能情况如何,此结果只是用来参考后面的NetBench测试。

  NetBench v7.03

  NetBench 7.03 Ent_dm.tst测试脚本模拟的是企业级文件服务器应用,它不但要求被测服务器的磁盘子系统可以提供足够的吞吐量,还需要其具有较高的IO处理能力,并且需要较为平衡的读取能力和写入能力。 

 
 NetBench性能测试

  仅能满足基本要求,如果你想做一个文件服务器,采用更高的硬盘配置是必须的,关于NetBench性能与处理器、内存、磁盘的关系可以看这里《评测机密:文件服务器性能提升N大要义

  Benchmark Factory 4.6

  我们在被测服务器上安装了Microsoft SQL 2005 SP1,按照测试要求建立了数据库。BF在测试之前会在数据库中生成9个表,其中包括4个500万行的表格,每行包括100字节的数据,因此每个表格容量大约是476MB,整个数据库容量为1.86GB。我们用60个客户端模拟1000个用户,在这个数据库中进行查询、添加、删除、修改等操作。

  
SQL2005数据库性能测试

  从我们以前的测试来看,双路E5504平台的数据库性能比双路E5430要强,现在来看,单路E5504(配合双通道DDR3-800)也能达到双路E5430的55%左右。

  我们利用UNI-T UT71E智能数字万用表和相配套的软件对于对于被测服务器在几种不同的状态下的功耗进行了监测,主要包括如下项目:

  • P1:连接电源但不开机状态

  • P2:系统启动完毕,5分钟内无动作,但不休眠

  • P3:系统启动完毕,处理器满载、磁盘以最大吞吐量工作

 

功耗

  显然,单路E5504处理器(2GHz,80W TDP)、4条DDR3内存(电压1.5V)、单个7200RPM SATA硬盘的配置让T260 G2服务器的功耗显得很低,满载只有126.7W,样机配置的600W服务器电源显得有些浪费。在双路处理器配置下,满载功率大概会提升100W左右。

  【IT168评测中心】联想的T260 G2服务器是一台塔式服务器,采用了基于Tylersburg-24D芯片的主板,面向的是小型工作组级别的应用。

 
联想万全T260 G2服务器

  T260 G2采用的主板只能实现双通道内存配置(每个处理器下),因此它不太适合内存密集型的应用,这些应用使用三通道会更好。我们收到的样机配置的是单颗E5504处理器,这颗处理器的规格并不高,其存在意义是表明现在Nehalem-EP/Xeon 5500系列处理器已经具有了全面的型号,可以满足从最低的入门级到最高端的Mission Critical应用(当然,这些应用推荐使用Nehalem-EX或者Itanium),是一个全面的解决方案。这些从低端到高端的处理器都采用一个接口,因此进行升级是相对容易的。

联想T260 G2服务器 

  从性能来看,单路E5504性能比我们的基准平台要低些,不过在Nehalem优秀架构的支持下,表现也很不错,特别是一些内存密集型的应用,如数据库表现就还可以,比起老平台来更有优势(对于单路处理器你也不能要求其比双路强太多,在成本更低的情况下)。纯粹的性能没什么意义,重要的是它是否能满足需求。联想T260 G2服务器就能满足低成本、高性价比的要求。

Intel Nehalem-EP处理器首发深度评测

直联架构的威力 Nehalem-EP处理器解析

Nehalem-EP 新Xeon 5500处理器首度曝光

透视六核心至强 Dunnington处理器解析

透视八核心至强 Nehalem-EX处理器解析

2008年度评测报告:深入Nehalem微架构

性能大幅提升 Core i7 服务器应用测试

再攀性能之巅 Intel全新酷睿i7深度评测

机密揭露:Intel超线程技术有多少种?

[IDF08]基辛格演讲:Nehalem集群演示

0
相关文章