【IT168评测中心】2003年,联想公司宣布其英文标识从Legend更换为Lenovo,其中Le取自原标识Legend,代表着秉承其一贯传统,新增加的novo取自拉丁词“新”,代表着联想的核心是创新精神。2004年,联想公司正式从Legend更名为Lenovo。
联想(Lenovo)是国内主要的服务器厂商之一,其第一台服务器早在1995年就出现了。联想的服务器系列以万全为名。我们收到的万全T260 G2是其推出的采用最新一代Nehalem-EP/至强5500系列处理器的服务器产品,我们以前测试的服务器基本都是机架式服务器,和它们不同,T260 G2是一台塔式服务器。T260的T或许是Tower(塔式)的意思。
塔式服务器的体积相对比较大,散热会比较好——不考虑机架式惯用的暴力散热风扇的话,因此相对而言塔式服务器的计算密度会低一些,不太适合机房使用。不过,塔式服务器不需要机架就可以使用,因此用于小型的企业会更适合,从定位来看,T260 G2应该是面向小型工作组应用,我们收到的样机配置的是单路至强 E5504,主频2.0GHz。
如图,主板最上的三条PCIE全部是由Tylersburg-24D提供的,不过速率不同,其中一条是x4,另两条是x8,除此之外,千兆网卡还额外使用了两条PCIE Lanes
在2005年度服务器横评之后,我们认为当时的网络实验室无法满足今后继续发展的服务器测试的需要。所以,2006年我们IT168评测中心又斥资几十万对于IT168网络实验室的服务器测试平台进行了大幅度的升级,为思科Catalyst4500千兆交换机(WS-X4013+ Supervisor Engine II-Plus和WS-X4548-GB-RJ45)增加了一个思科全千兆24口模块WS-X4424-GB-RJ45,可同时连接72个千兆铜缆设备和2个光缆设备。另外,我们还购置了29台Dell PowerEdge SC430塔式服务器和原来的32台主流配置PC一起为服务器测试平台的提供负载。2007年,我们又采购性能更强的部分客户端,来确保为新一代的服务器提供足够的测试负载。2009年初,我们又对所有客户端的内存子系统进行了全面的升级。
Catalyst4500千兆交换机
部分Dell PowerEdge SC430服务器
在新的测试环境下,我们进一步完善了服务器性能测试方案:
SPEC CPU 2006 v1.0.1
SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPEC CPU 2006是SPEC组织推出的CPU子系统评估软件最新版,我们之前使用的是SPEC CPU 2000。和上一个版本一样,SPEC CPU 2006包括了CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能,SPEC CPU 2006中对SPEC CPU 2000中的一些测试进行了升级,并抛弃/加入了一些测试,因此两个版本测试得分并没有可比较性。
SPEC CPU测试中,测试系统的处理器、内存子系统和使用到的编译器(SPEC CPU提供的是源代码,并且允许测试用户进行一定的编译优化)都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2006的影响非常的小。
SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。
我们在被测服务器中安装了当前最新版本的Intel C++ 10.1.025 Compiler、Intel Fortran 10.1.025 Compiler这两款SPEC CPU 2006必需的编译器,通过最新出现的QxS编译参数,Intel Compiler 10版本开始支持对Intel SSE4指令集进行优化(假如只支持SSE3,则使用QxT编译参数)。我们另外安装了Microsoft Visual Studio 2003 SP1提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,使用了较多的编译选项。我们根据被测系统选择实际可同时处理的线程数量,最后得到SPEC rate base测试结果(基于base标准编译,SPEC base rate测试代表系统同时处理多个任务的能力)。
和其它测试部件不同,SPEC CPU 2006需要大量的系统物理内存,我们的SPEC测试在64bit Windows Server 2008 Enterprise下完成,对于每个运算核心,最低配置1.5GB内存。
SiSoftware Sandra v2009
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。从2007开始,Sandra的Arithmetic benchmarks增加了对SSE3 & SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台,这也是我们选择这款软件的原因之一。
Benchmark Factory 4.6
大部分的服务器应用都同数据库有着密切的联系,因此我们今年开始着手在在服务器测试中加入对于数据库性能的测试。我们选择了Benchmark Factory 4.6软件和Microsoft SQL2005 SP3来测试不同的硬件平台在数据库应用中的表现。
我们选择了Benchmark Factory内置的标准测试脚本AS3AP,这项测试可用于对于ANSI结构化查询语言(SQL)关系型数据库进行测试,它可用于测试DBMS(单用户微机数据库管理系统),也可用于测试高性能并行或者分布式数据库。
NetBench v7.03
NetBench是针对文件服务器的性能测试软件,影响NetBench性能的主要是服务器的磁盘子系统,服务器磁盘控制器、条带大小、读写缓存、硬盘类型、组建磁盘阵列模式、内存容量、网络拓朴结构等都会对测试结果有明显的影响。我们在被测服务器上设立了文件服务器,NetBench通过网络实验室中60个客户端来模拟网络中的PC向文件服务器所发出的文件传输请求,文件服务器则将存储在磁盘上的文件数据发送给相应的客户端。在测试过程中,客户端会以每四台一组的步进依次增加并且向服务器发送文件传输请求,测试结束后控制台收集数据并绘制出服务器的数据传输变化曲线。
系统功耗监测
我们使用UNI-T UT71E智能数字万用表对于被测服务器系统的整体功耗进行了监测,利用随机附带的接口程序,我们可以记录被测服务器任意时间段内的功率变化。
主板只支持双通道内存,此外,CPU的内置内存控制器仅支持到DDR3 800
测试平台、测试环境 | |||||
测试分组 | |||||
类别 | Lenovo T260 G2 单路Intel Gainestown Xeon E5504 | 双路Intel Harpertown Xeon E5430 | |||
处理器子系统 | |||||
处理器 | 单路Intel Xeon E5504 | 双路Intel Xeon E5430 | |||
处理器架构 | Intel 45nm Nehalem | Intel 45nm Penryn | |||
处理器代号 | Gainestown | Harpertown | |||
处理器封装 | Socket 1366 LGA | Socke 771 LGA | |||
处理器规格 | 四核 | 四核 | |||
处理器指令集 | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,SSE4.2,EM64T,VT | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,EM64T,VT | |||
主频 | 2.00GHz | 2.66GHz | |||
处理器外部总线 | 2x QPI 2400MHz 4.8GT/s 单向9.6GB/s(每QPI) 双向19.2GB/s(每QPI) | FSB 333MHz 1333MT/s 10.6GB/s | |||
L1 D-Cache | 4x 32KB 8路集合关联 | 4x 32KB 8路集合关联 | |||
L1 I-Cache | 4x 32KB 4路集合关联 | 4x 32KB 8路集合关联 | |||
L2 Cache | 4x 256KB 8路集合关联 | 2x 6144KB 16路集合关联 | |||
L3 Cache | 4MB @ 1600MHz 16路集合关联 | ||||
主板 | |||||
主板型号 | Intel S5500BC | DELL PE 2900 III | |||
芯片组 | Intel Tylersburg-EP IOH:Intel 5500(Tylersburg-24D) ICH:Intel 82801JR(ICH10R) | MCH:Intel 5000X ICH:Intel ESB6321 | |||
芯片特性 | 2x QPI 24 PCI Express Gen2 Lanes VT-d Gen 2 | 2x FSB1333 PCI Express Gen1 Lanes 12MB Snoop Filter VT-d Gen 1 | |||
内存控制器 | 每CPU集成三通道R-ECC DDR3 800 主板实现双通道 | 北桥集成四通道FBD DDR2 667 | |||
内存 | 2GB ECC DDR3 800 SDRAM x4 | 2GB FBD DDR2 667 SDRAM x4 | |||
系统磁盘子系统 | |||||
磁盘控制器 | Intel ICH10R SATA AHCI Controller | DELL Perc 5/i RAID Controller | |||
磁盘控制器规格 | 6x SATA 3Gb/s AHCI w/NCQ | Intel IOP333 | |||
磁盘控制器设置 | AHCI w/NCQ | RAID 5 | |||
磁盘控制器驱动 | IMSM 8.8.0.1006 | LSI MegaRAID R3.6 3.9.0.64 | |||
磁盘 | Hitachi Deskstar P7K500 HDP725025GLA380 | Seagate Cheetah 15K.5 ST314655SS x3 | |||
磁盘规格 | 7200RPM 250GB SATA 3Gb/s w/NCQ 8MB Cache | 15000RPM 146GB SAS 3Gb/s 16MB Cache | |||
磁盘设置 | SATA 3Gb/s w/NCQ 50GB系统分区 | SAS 3Gb/s 20GB系统分区 | |||
网络子系统 | |||||
网卡 | Intel 82574L Gigabit Network Controller x2 | Broadcom BCM5708C PCI-E千兆网卡 x2 | |||
网卡设置 | PCI Express x1 @ ICH10R Intel NIC Teaming Load Balancing | PCI Express x1 @ ESB6321 Broadcom NIC Teaming Load Balancing | |||
网卡驱动 | Intel PRO Set 14.0 | Broadcom NetXtreme 2 11.04.01 | |||
软件环境 | |||||
操作系统 | Microsoft Windows Server 2008 Enterprise Edition SP1 x64 | Microsoft Windows Server 2008 Enterprise Edition SP1 x64 |
这个测试配置可说是我们测过的Nehalem-EP处理器最低端的配置:单路处理器、双通道内存。可见T260 G2服务器面向的定位是小型工作组,它的价格也是很低的。
SPEC CPU 2006整数运算主要包含编译、压缩、人工智能、视频压缩转换、XML处理等,此外,各种日常操作也主要是基于整数操作。SPEC CPU 2006的整数运算包含了400.perlbench PERL编程语言、401.bzip2 压缩、403.gcc C编译器、429.mcf 组合优化、445.gobmk 人工智能:围棋、456.hmmer 基因序列搜索、458.sjeng 人工智能:国际象棋、462.libquantum 物理:量子计算、464.h264ref 视频压缩、471.omnetpp 离散事件仿真、473.astar 寻路算法、483.xalancbmk XML处理共12项。
SPEC CPU 2006整数运算性能
单路的情况下确实和双路基准平台有些距离。我们之前测试过双路E5504的情况,比基准平台略好。在测试中,少数项目是比基准平台性能更好的,如462.libquantum物理:量子计算这样的项目,这是因为Nehalem-EP在单路、无超线程技术的情况下仍然具有内置内存控制器这一优势。
SPEC CPU 2006的浮点运算测试包括的全部都是科学运算,科学运算需要用到大量的高精度浮点数据,如410.bwaves 流体力学、416.gamess 量子化学、433.milc 量子力学、434.zeusmp 物理:计算流体力学、435.gromacs 生物化学/分子力学、436.cactusADM 物理:广义相对论、437.leslie3d 流体力学、444.namd 生物/分子、447.dealII 有限元分析、450.soplex 线形编程、优化、453.povray 影像光线追踪、454.calculix 结构力学、459.GemsFDTD 计算电磁学、465.tonto 量子化学、470.lbm 流体力学、481.wrf 天气预报、482.sphinx3 语音识别共17项测试。
SPEC CPU 2006浮点运算性能
浮点的情况也类似,双拳难敌四手,四核难敌八核……和前面一样,一些项目上单路E5504也能比双路E5430更强,并且非常明显,如410.bwaves流体力学这样的项目,这表现了内置内存控制器的优势。
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,它可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。我们利用了其中多个性能测试模块对于被测系统的性能进行了快速的测试。
有一点需要说明的是,Sandra的处理器架构性能测试是根据处理器所能支持的所有指令集中选择进行的,不同的处理器支持的指令集不同,测试使用到的指令集也就不同。例如,Nehalem在这个测试当中就可以使用SSE4.2,而Penryn就只能使用SSE4.1,而用Opteron可能就只能到SSE3了。一般而言,由于可以使用SSE4,Intel的处理器理论性能会比较好。
SiSoftware Sandra Pro Business 2009 | ||
---|---|---|
测试对象 | Lenovo T260 G2 单路Intel Gainestown Xeon E5504 2.0GHz | 双路Intel Harpertown Xeon E5430 2.66GHz |
Processor Arithmetic Benchmark 处理器架构测试 | ||
Dhrystone ALU | 49318MIPS | 91006MIPS |
Dhrystone ALU vs SPEED | 24.66MIPS/MHz | 34.21MIPS/MHz |
Whetstone iSSE3 | 26064MFLOPS | 78385MFLOPS |
Dhrystone iSSE3 vs SPEED | 13.03MFLOPS/MHz | 29.47MFLOPS/MHz |
Processor Multi-Media Benchmark 处理器多媒体测试 | ||
Multi-Media Int x16 iSSE4.1 | 84.83MPixel/s | |
Multi-Media Int x8 iSSE4.1 | 199.33MPixel/s | |
Multi-Media Int x16 iSSE4.1 vs SPEED | 42.41kPixel/s/MHz | |
Multi-Media Int x8 iSSE4.1 vs SPEED | 74.94kPixel/s/MHz | |
Multi-Media Float x8 iSSE2 | 64.72MPixel/s | |
Multi-Media Float x4 iSSE2 | 108.69MPixel/s | |
Multi-Media Float x8 iSSE2 vs SPEED | 32.36kPixels/s/MHz | |
Multi-Media Float x4 iSSE2 vs SPEED | 40.86kPixels/s/MHz | |
Multi-Media Double x4 iSSE2 | 33.81MPixel/s | |
Multi-Media Double x2 iSSE2 | 55.75MPixel/s | |
Multi-Media Double x4 iSSE2 vs SPEED | 16.91kPixels/s/MHz | |
Multi-Media Double x2 iSSE2 vs SPEED | 20.96kPixels/s/MHz | |
Multi-Core Efficiency Benchmark | ||
Inter-Core Bandwidth | 9.73GB/s | 20.54GB/s |
Inter-Core Bandwidth vs SPEED | 4.98MB/s/MHz | 7.91MB/s/MHz |
Inter-Core Latency (越小越好) | 74ns | 90ns |
Inter-Core Latency vs SPEED (越小越好) | 0.04ns/MHz | 0.03ns/MHz |
Cryptography 加密性能测试 | ||
AES256 CPU Cryptographic Bandwidth | 326MB/s | |
AES256 CPU Cryptographic Bandwidth VS SPEED | 0.16MB/s/MHz | |
SHA256 CPU Hashing Bandwidth | 373MB/s | |
SHA256 CPU Hashing Bandwidth vs SPEED | 0.19MB/s/MHz | |
.NET Arithmetic Benchmark .NET架构测试 | ||
Dhrystone .NET | 8103MIPS | 10562MIPS |
Dhrystone .NET vs SPEED | 4.05MIPS/MHz | 3.97MIPS/MHz |
Whetstone .NET | 17394MFLOPS | 45399MFLOPS |
Whetstone .NET vs SPEED | 8.70MFLOPS/MHz | 17.07MFLOPS/MHz |
.NET Multi-Media Benchmark .NET多媒体测试 | ||
Multi-Media Int x1 .NET | 17.02MPixel/s | 31.28MPixel/s |
Multi-Media Int x1 .NET vs SPEED | 8.51kPixels/s/MHz | 11.76kPixels/s/MHz |
Multi-Media Float x1 .NET | 4.99MPixel/s | 8.68MPixel/s |
Multi-Media Float x1 .NET vs SPEED | 2.49kPixels/s/MHz | 3.26kPixels/s/MHz |
Multi-Media Double x1 .NET | 9.28MPixel/s | 24.75MPixel/s |
Multi-Media Double x1 .NET vs SPEED | 4.64kPixels/s/MHz | 9.30kPixels/s/MHz |
和以前的测试项目我们又增加了一个Cryptography加密的测试。从结果来看,和SPEC CPU 2006测试比较相似,单路E5504(2.0GHz)只有双路E5430(2.66GHz)的50%~60%左右。
SiSoftware Sandra缓存内存测试主要包括内存带宽、内存延迟等性能的测试。
SiSoftware Sandra Pro Business 2009 | ||
---|---|---|
测试对象 | Lenovo T260 G2 单路Intel Gainestown Xeon E5504 2.0GHz | 双路Intel Harpertown Xeon E5430 2.66GHz |
Memory Bandwidth Benchmark 内存带宽测试 | ||
Int Buff'd iSSE2 Memory Bandwidth | 9.98GB/s | 6.13GB/s |
Int Buff'd iSSE2 Memory Bandwidth vs SPEED | 9.43MB/s/MHz | |
Float Buff'd iSSE2 Memory Bandwidth | 9.98GB/s | 6.13GB/s |
Float Buff'd iSSE2 Memory Bandwidth vs SPEED | 9.43MB/s/MHz | |
Memory Latency Benchmark(Random) 内存延迟测试(随机) | ||
Memory(Random Access) Latency (越小越好) | 108ns | 108ns |
Speed Factor (越小越好) | 52.50 | 95.20 |
Internal Data Cache | 4clocks | 3clocks |
L2 On-board Cache | 10clocks | 18clocks |
L3 On-board Cache | 48clocks | |
Memory Latency Benchmark(Linear) 内存延迟测试(线性) | ||
Memory(Linear Access) Latency (越小越好) | 9ns | 20ns |
Speed Factor (越小越好) | 4.40 | 17.30 |
Internal Data Cache | 4clocks | 3clocks |
L2 On-board Cache | 10clocks | 13clocks |
L3 On-board Cache | 12clocks | |
Cache and Memory Benchmark 缓存及内存测试 | ||
Cache/Memory Bandwidth | 36.81GB/s | 68.88GB/s |
Cache/Memory Bandwidth vs SPEED | 18.85MB/s/MHz | 26.52MB/s/MHz |
Speed Factor (越小越好) | 33.40 | 111.90 |
Internal Data Cache | 163.13GB/s | 421.23GB/s |
L2 On-board Cache | 137.45GB/s | 122.68GB/s |
SiSoftware Sandra对比
由于内置内存控制器,因此单路E5504的表现也很好,只是在缓存方面受到了低主频的影响。E5504的L1、L2都和CPU主频一致,为2.0GHz,L3则比较独立,为1.6GHz。E5430的L1、L2都和CPU主频一样,即2.66GHz,E5430没有L3缓存。
NetBench v7.03
NetBench 7.03 Ent_dm.tst测试脚本模拟的是企业级文件服务器应用,它不但要求被测服务器的磁盘子系统可以提供足够的吞吐量,还需要其具有较高的IO处理能力,并且需要较为平衡的读取能力和写入能力。
仅能满足基本要求,如果你想做一个文件服务器,采用更高的硬盘配置是必须的,关于NetBench性能与处理器、内存、磁盘的关系可以看这里《评测机密:文件服务器性能提升N大要义》。
Benchmark Factory 4.6
我们在被测服务器上安装了Microsoft SQL 2005 SP1,按照测试要求建立了数据库。BF在测试之前会在数据库中生成9个表,其中包括4个500万行的表格,每行包括100字节的数据,因此每个表格容量大约是476MB,整个数据库容量为1.86GB。我们用60个客户端模拟1000个用户,在这个数据库中进行查询、添加、删除、修改等操作。
从我们以前的测试来看,双路E5504平台的数据库性能比双路E5430要强,现在来看,单路E5504(配合双通道DDR3-800)也能达到双路E5430的55%左右。
我们利用UNI-T UT71E智能数字万用表和相配套的软件对于对于被测服务器在几种不同的状态下的功耗进行了监测,主要包括如下项目:
P1:连接电源但不开机状态
P2:系统启动完毕,5分钟内无动作,但不休眠
P3:系统启动完毕,处理器满载、磁盘以最大吞吐量工作
功耗
显然,单路E5504处理器(2GHz,80W TDP)、4条DDR3内存(电压1.5V)、单个7200RPM SATA硬盘的配置让T260 G2服务器的功耗显得很低,满载只有126.7W,样机配置的600W服务器电源显得有些浪费。在双路处理器配置下,满载功率大概会提升100W左右。
【IT168评测中心】联想的T260 G2服务器是一台塔式服务器,采用了基于Tylersburg-24D芯片的主板,面向的是小型工作组级别的应用。
T260 G2采用的主板只能实现双通道内存配置(每个处理器下),因此它不太适合内存密集型的应用,这些应用使用三通道会更好。我们收到的样机配置的是单颗E5504处理器,这颗处理器的规格并不高,其存在意义是表明现在Nehalem-EP/Xeon 5500系列处理器已经具有了全面的型号,可以满足从最低的入门级到最高端的Mission Critical应用(当然,这些应用推荐使用Nehalem-EX或者Itanium),是一个全面的解决方案。这些从低端到高端的处理器都采用一个接口,因此进行升级是相对容易的。
从性能来看,单路E5504性能比我们的基准平台要低些,不过在Nehalem优秀架构的支持下,表现也很不错,特别是一些内存密集型的应用,如数据库表现就还可以,比起老平台来更有优势(对于单路处理器你也不能要求其比双路强太多,在成本更低的情况下)。纯粹的性能没什么意义,重要的是它是否能满足需求。联想T260 G2服务器就能满足低成本、高性价比的要求。