【IT168 评测】IT168一年一度的服务器横评又开始了。结合今年的新品,本次横评内容以至强E3平台作为主要方向,通过对不同配置的E3服务器对比,以及在软件和设计上的功能,全面分析目前单路E3服务器市场的现状,为用户提供可靠的选购参考。今天,我们要介绍的是来自方正送测的基于至强E3平台的产品——方正圆明LT200。
方正圆明LT200
方正圆明LT200服务器是方正在今年与宏碁战略整合之后推出的第一款服务器。相比我们之前见的塔式服务器来说,方正圆明LT200的体积要更为小巧,只有常用的PC机大小。
方正圆明LT200服务器正反面
方正圆明LT200服务器的前面板设计比较简单,并没有提供热插拔的位置。值得一提的是它的开关键,采用的是一体式的弹性按键,不会因为长久使用而老化。机身背面,我们看到了1个网络接口,同样也是比较简单。
机箱内部设计
我们打开了方正圆明LT200服务器的侧面,途中凡是绿色的位置都可以实现免工具拆卸。免工具拆卸在国际品牌的服务器,比如IBM、HP、DELL中是比较常见的,但是像这样国产服务器中,而且针对单路塔式机的还真不太多。我们可以明显的看到方正圆明LT200服务器的硬盘位置实现了免工具拆解,这对于大家增加或者更换硬盘来说都很方便。
方正圆明LT200服务器电源
方正圆明LT200服务器使用的是通过80PLUS铜牌认证的全汉电源,电源的最大功率为450W。在之前我们介绍联想T168 G7服务器的时候,发现电源的功率只有130W;而方正圆明LT200服务器搭配了450W的电源,投入还真不小,充分保证了服务器的供电系统稳定。而且80PLUS认证是目前电源行业中的权威认证,这款铜牌电源更说明它是一款注重与节能环保的产品。
作为国产服务器的经典产品,方正圆明LT200服务器的优势还不仅仅体现在电源方面,包括处理器、内存等配件都突出了节能的理念。
至强E3-1270处理器
方正圆明LT200服务器搭配的处理器是至强E3-1270,它是至强系列家族中的高端产品,主频为3.4GHz,具备了4核心8线程,TDP功耗为80W。对于中小企业来说,能够选配至强E3-1270就已经是非常好的选择了,虽然还有更高主频的1280和1290,对应的功耗也更多一些。
来自三星的2GB DDR3 ECC内存
被测服务器提供了2条三星2GB DDR3 ECC内存,依然是属于ECC UnBuffered。出于测试软件的考虑,我们在测试中更换为8GB,以完成SPEC CPU 2006的测试,特此说明。
来自西部数据的WD5000AAKS硬盘
方正圆明LT200服务器标配了3块容量为500GB的SATA硬盘,我们在测试时组建了RAID 5阵列,当然用的还是板载的阵列卡。
扩展插槽
通常情况下,塔式服务器会预留大量的扩展位置,本次测试的方正圆明LT200服务器提供了1条PCI-E X16、1条PCI-E X8、1条PCI-E X4,还有1个PCI插槽。一般情况下,得益于主板的高度集成,这些扩展槽只是用来连接阵列卡。
板载的XGI显卡,右面的模块是现存颗粒
显示方面,方正圆明LT200服务器使用了XGI Z9s显示芯片,搭配了32MB显存颗粒。
来自Intel的千兆网卡芯片
正如我们之前谈到的,方正圆明LT200服务器只提供了1个千兆网络接口,也就是使用了这款——WG82579LM网络芯片。单网口产品在网络测试中会比较吃亏,因为双网卡可以实现Teaming功能,实现吞吐量的翻倍;而单网口受限于硬件条件,只能实现更低的性能。
对于服务器的测试,我们主要从产品满足用户应用的角度出发,分功能和性能两个方面来考察。其中性能测试主要体现的是服务器在提供特定服务时的具体的事务处理能力,而在功能上,主要反映的是服务器的可靠性、可扩展性以及易用性等方面的特征。另外,由于不论是最终用户还是处理器厂商,大家对于服务器的能耗问题都给以了很高的重视,为此,我们也继续将能耗作为考察服务器使用成本的重要指标。
▲网络测试环境
贴近应用的性能测试
在实际的应用中,不同的应用条件对于服务器子系统性能的要求也有一定的偏重,因此同一服务器在不同应用中所表现出的性能状况常会出现较大差异。为了能准确反映出服务器的性能状况,我们选择了Web、文件服务器和数据库等三种较为普遍的应用作为测试重点。之所以选用以上三种应用作为性能测试点,这几项应用相对较为普遍是原因之一,此外我们也考虑到这三种应用对于服务器子系统的要求也各有偏重,这样可以更全面的考察服务器各子系统的性能状况。
讲求实用的功能测试
可靠性、可扩展性和易用性同样也是用户关心的内容,但不同的用户对这三方面的需求会有所不同。比如一些中高端服务器产品,在应用中多采用专用机房或托管方式,这时其易用性中的可管理性方面就显得非常重要,远程管理会让工程师及时了解服务器工作状况,实现及时有效的管理和维护。而对于入门级服务器来说,由于很多用户会随着业务的增长会对其处理能力、存储容量有进一步的要求,这时其可扩展性就显得更为重要。可靠性是服务器的一个关键特性,它反映了服务器在应用过程中系统能否确保长时间正常工作,这也是服务器与普通PC之间的重要区别。对于以上三个方面,我们都制定了详细项目进行逐一考察。
兼顾使用成本的能效测试
服务器的售价反映的它是一次性的购买成本,而后期的使用成本是一个不容小视的问题,作为一个要求7×24连续工作的设备,它所产生的电费将是一笔不小的开销。实际上在评判服务器的运算能力时,一定不能将功耗问题视而不见,性能功耗比是衡量服务器运算效能的一个重要指标,测试中我们利用功率分析仪对服务器在加电关机、开机空载以及满负载三种状态下的功耗进行测定,为服务器的能效以及使用成本的估算提供数据支持。
为了进行网络产品的测试,IT168评测中心专门组建了网络实验室,并搭建了一个有60台客户端的网络测试环境,通过控制端并利用专业的网络测试软件,可以构建出多样化的网络访问模型,能够产生真实的多用户网络应用环境。可以对服务器类设备进行不同应用下的高压力性能测试,以直观的结果反映出服务器产品在用于不同应用时其真实的性能状况。
我们采用千兆交换机作为测试环境的交换设备,60台单路服务器作为客户端,能产生足够大的网络访问压力,因而可以测试服务器类设备在实现不同应用时的极限性能。
▲网络实验室控制台
▲千兆交换机,120个千兆网口
▲用于产生用户访问压力的塔式服务器
对于服务器性能方面的考察,我们主要分为子系统测试和应用性能测试。在子系统测试中我们按处理器、内存以及磁盘等各个子系统进行了分项测试,当然各子系统的测试成绩也是相辅相成,也需要其它子系统的支持,并非是完全独立的,只是对考察的子系统有所偏重而已。
处理器子系统测试
对服务器处理器子系统的考察,我们主要采用的是业界公认的SPEC CPU 2006测试,该项测试通过对数十个典型应用程序的运行,来测试系统处理器子系统在应用中的整、浮点运算效率。SPEC CPU 2006测试具有很好的开放性,因此在业界为广大用户所接受,可以利用这一公开的测试结果进行系统间运算性能的比较。
此外SiSoftware Sandra也有测试子项可用于处理器运算性能测试,其结果通常以每秒完成的指令数来表现。也可以用作不同处理器间运算效率的比较。
SPEC CPU 2006 v1.1
SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPEC CPU 2006是SPEC组织推出的CPU子系统评估软件最新版,我们之前使用的是SPEC CPU 2000。和上一个版本一样,SPEC CPU 2006包括了CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,后者则用于测量和对比浮点性能,SPEC CPU 2006中对SPEC CPU 2000中的一些测试进行了升级,并抛弃/加入了一些测试,因此两个版本测试得分并没有可比较性。
SPEC CPU测试中,测试系统的处理器、内存子系统和使用到的编译器(SPEC CPU提供的是源代码,并且允许测试用户进行一定的编译优化)都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2006的影响非常的小。
SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。
我们在被测服务器中安装了Intel C++ 11.1.034 Compiler、Intel Fortran 11.1.034 Compiler这两款SPEC CPU 2006必需的编译器,通过最新出现的QxS编译参数,Intel Compiler 10版本开始支持对Intel SSE4指令集进行优化(假如只支持SSE3,则使用QxT编译参数)。我们另外安装了Microsoft Visual Studio 2003 SP1提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,使用了较多的编译选项。我们根据被测系统选择实际可同时处理的线程数量,最后得到SPEC rate base测试结果(基于base标准编译,SPEC base rate测试代表系统同时处理多个任务的能力)。
和其它测试部件不同,SPEC CPU 2006需要大量的系统物理内存,我们的SPEC测试在64位的Windows Server 2008 R2 下完成,对于每个运算核心,最低配置1.5GB内存。
- 内存子系统测试
对于内存子系统的考察,也是利用SiSoftware Sandra来实现,在该软件中有相应组件可进行内存带宽、内存延迟等方面的测试。
SiSoftware Sandra v2011
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。从2007开始,Sandra的Arithmetic benchmarks增加了对SSE3&SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一,SiSoftware Sandra 2011对NUMA架构以及最新的Windows 7/Windows Server 2008 R2提供了更好的支持,此外测试项目和测试结果也有了略微的变化。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。
- 存储子系统测试
对存储子系统的考察,是利用IOMeter这一软件来完成。
IOMeter 2006.07.27
IOMeter是一款功能非常强大的IO测试软件,它除了可以在本机运行测试本机的磁盘IO性能之外,还提供了模拟网络应用的能力。为了大家能更好的通过我们的测试数据进行不同系统之间的对比,我们在测试中都使用相同的脚本。其中的最大IO能力的测试中我们所采用的了数据块大小为512B,100%读取操作,随机率为0%。而另一测试数据块大小则选择了64KB,100%读取操作,随机率为0%,用于检测磁盘系统的最大吞吐量。
- 网络应用性能测试
应用性能测试则利用IT168的网络测试环境,模拟大量的客户端来实现对服务器进行访问,来测试服务器在提供文件服务器时的性能表现。
NetBench 7.03性能测试
NetBench是针对文件服务器的性能测试软件,影响NetBench性能的主要是服务器的磁盘子系统,这里所使用的磁盘RAID卡对于测试结果将会有明显的影响。测试中我们在被测服务器上设立了文件服务器,NetBench通过网络实验室中60个客户端来模拟网络中的PC向文件服务器所发出的文件传输请求,文件服务器则将存储在磁盘上的文件数据发送给相应的客户端。同Webbench测试一样,NetBench测试开始后客户端会以每四台一组依连接到服务器并发送文件传输请求。测试结束后控制台收集数据并绘制出服务器能够达到的数据传输变化曲线。
服务器平台信息 | ||
产品名称 | 联想T168 G7服务器 | 方正圆明LT200服务器 |
平台类型 | 单路Intel Sandy Bridge-E3 | 单路Intel Sandy Bridge-E3 |
处理器子系统 | ||
---|---|---|
处理器型号 | Intel Xeon E3-1220 | Intel Xeon E3-1270 |
处理器架构 | Intel 32nm Sandy Bridge | Intel 32nm Sandy Bridge |
代号 | Sandy Bridge | Sandy Bridge |
处理器封装 | Socket 1155 LGA | Socket 1155 LGA |
核心/线程数量 | 4/4 | 4/8 |
主频 | 3.1GHz | 3.4GHz |
处理器指令集 | MMX,SSE,SSE2,SSE3, | MMX,SSE,SSE2,SSE3, |
外部总线 | DMI 5.0GT/S | DMI 5.0GT/S |
L1 Code Cache | 4× 32KB 8路集合关联 | 4× 32KB 8路集合关联 |
L1 Data Cache | 4× 32KB 4路集合关联 | 4× 32KB 4路集合关联 |
L2 Cache | 4× 256KB 8路集合关联 | 4× 256KB 8路集合关联 |
L3 Cache | 8MB 16路集合关联 | 8MB 16路集合关联 |
服务器主板 | ||
主板型号 | LENOVO | Acer GA-6UASL1 |
主板芯片组 | LENOVO | Intel ID0108 |
北桥芯片特性 | 2×QPI VT-d Gen 2 | 2×QPI VT-d Gen 2 |
内存子系统 | ||
内存控制器 | 每CPU集成双通道U-ECC DDR3 1333 | 每CPU集成双通道U-ECC DDR3 1333 |
内存类型 | 4GB R-ECC DDR3 1333 SDRAM ×2条 | 4GB R-ECC DDR3 1333 SDRAM ×2条 |
存储子系统 | ||
磁盘控制器 | Intel ICH10R RAID Controller | Intel ICH10R RAID Controller |
磁盘控制器规格 | 8x SATA 3Gb/s MatrixRAID 0/1/3/5 | 8x SATA 3Gb/s MatrixRAID 0/1/3/5 |
控制器驱动 | Intel Matrix Storage Manager 8.8.0.1009 x64 | Intel Matrix Storage Manager 8.8.0.1009 x64 |
硬盘型号数量 | WD WD5000AAKX | WD WD5000AAKS |
硬盘规格 | 7200RPM 500GB SATA 3Gbps 16MB Cache | 7200RPM 500GB SATA 3Gbps 16MB Cache |
软件环境 | ||
操作系统 | Microsoft Windows Server 2008 Enterprise R2 x64 | Microsoft Windows Server 2008 Enterprise R2 x64 |
本次测试中,我们选择了联想T168 G7服务器作为对比产品。从配置来说,方正LT200服务器在处理器、内存、磁盘等方面都比联想的对比产品略高,只是在网络配置上使用了单个网卡,这势必会严重影响网络测试的成绩。另外,针对SPEC测试的特点,我们在特定的测试中使用了8GB的内存,主要是为了保证各个处理器线程能够最大程度的发挥性能。
鉴于本次测试的E3-1270处理器是工程样品,所以在之前的照片中并没有看到具体的型号。但是通过专业的CPU-Z测试软件,处理器的信息就可以一览无余了。
至强E3-1270处理器,后面标明是ES(测试版)
处理器缓存和线程信息
方正LT200服务器信息
系统内存为8GB(SPEC中会增加到16GB)
测试时使用了南亚的4GB内存
开启SMT技术之后,8个处理器线程都可以看到
处理器的内存控制器信息,显示内存为双通道工作模式
Sisoftware Sandra 2011是最新版的Sisoftware Sandra测试软件,只所以选择这款软件是因为只有它能够实现对于至强E3处理器的测试,而老版本的2010则完全不能运行。虽然我们测试使用的是Lite版本,但是并不影响对于性能的考量。
SiSoftware Sandra Pro Business 2011 | ||
产品名称 | 联想T168 G7 | 方正圆明LT200服务器 |
平台类型 | 单路Intel SandyBridge | 单路Intel SandyBridge |
Processor Arithmetic Benchmark 处理器算术运算测试 | ||
---|---|---|
总计本地功效 | 66.59GOPS | 106.63GOPS |
总计本地功效对比速度 | 19.63MOPS/MHz | 28.13MOPS/MHz |
Dhrystone iSSE4.2 | 97.37GIPS | 136.57GIPS |
Dhrystone iSSE4.2 vs SPEED | 28.71MIPS/MHz | 36.03MIPS/MHz |
Whetstone iSSE3 | 45.54GFLOPS | 83.24GFLOPS |
Dhrystone iSSE3 vs SPEED | 13.43MFLOPS/MHz | 21.96MFLOPS/MHz |
Processor Multi-Media Benchmark 处理器多媒体测试 | ||
总计多媒体功效 | 123.15MPixel/s | 175MPixel/s |
总计多媒体功效测试结果 | 47.89GOPS | 68GOPS |
Multi-Media Int x16 iSSE4.1 | 149.37MPixel/s | 200.78MPixel/s |
Multi-Media Int x16 iSSE4.1 vs SPEED | 58kPixels/s/MHz | 78kPixels/s/MHz |
Multi-Media Float x8 iSSE2 | 101.53MPixel/s | 152.7MPixel/s |
Multi-Media Float x8 iSSE2 vs SPEED | 39.48kPixels/s/MHz | 59.38kPixels/s/MHz |
Multi-Media Double x4 iSSE2 | 55MPixel/s | 83.4MPixel/s |
Multi-Media Double x4 iSSE2 vs SPEED | 21.42kPixels/s/MHz | 32.43kPixels/s/MHz |
Multi-Core Efficiency Benchmark 处理器效能测试 | ||
内联核带宽 | 8.24GB/s | 22GB/s |
内联核带宽对比速度 | 2.49MB/s/MHz | 5.92MB/s/MHz |
内联核延迟(越小越好) | 42.4ns | 41.0ns |
内联核延迟对比速度(越小越好) | 0.13ns/MHz | 0.11ns/MHz |
Java算数性能测试 | ||
总计 Java 功效 | 54.22GOPS | 81.28GOPS |
总计 Java 功效对比速度 | 15.98MOPSMHz | 22.02MOPSMHz |
Dhrystone Java | 111GIPS | 131.65GIPS |
Dhrystone Java对比速度 | 32.70GFLOPS | 35.67GFLOPS |
Whetstone Java | 26.5MIPSMHz | 50.18MIPSMHz |
Whetstone Java对比速度 | 7.81MFLOPSMHz | 13.60MFLOPSMHz |
Java多媒体性能测试 | ||
总计多媒体Java功效 | 16.88MPixel/s | 28.22MPixel/s |
总计多媒体Java功效对比速度 | 4.98kPixels/s/MHz | 7.4482kPixels/s/MHz |
多媒体整数 x1 Java | 19.4MPixel/s | 29.65MPixel/s |
多媒体整数 x1 Java对比速度 | 5.72kPixels/s/MHz | 7.8282kPixels/s/MHz |
多媒体浮点数 x1 Java | 14.69MPixel/s | 26.86MPixel/s |
多媒体浮点数 x1 Java对比速度 | 4.33kPixels/s/MHz | 7.0882kPixels/s/MHz |
多媒体双精度 x1 Java | 14.75MPixel/s | 26.75MPixel/s |
多媒体双精度 x1 Java对比速度 | 4.35kPixels/s/MHz | 7.0682kPixels/s/MHz |
.NET Arithmetic Benchmark .NET算术运算测试 | ||
总计 .NET 功效 | 20.18GOPS | 30.17GOPS |
总计 .NET 功效对比速度 | 5.95MOPSMHz | 7.96MOPSMHz |
Dhrystone .NET | 14.64GIPS | 17.73GIPS |
Dhrystone .NET vs SPEED | 4.32MIPS/MHz | 4.68MIPS/MHz |
Whetstone .NET | 27.82GFLOPS | 51.33GFLOPS |
Whetstone .NET vs SPEED | 8.20MFLOPS/MHz | 13.54MFLOPS/MHz |
.NET Multi-Media Benchmark .NET多媒体测试 | ||
总计多媒体.NET功效 | 14MPixel/s | 22.65MPixel/s |
总计多媒体.NET功效对比速度 | 4.14kPixels/MHz | 5.97kPixels/MHz |
多媒体整数 x1 .NET | 26.6MPixel/s | 37.58MPixel/s |
多媒体整数x1 .NET vs SPEED | 7.84kPixels/s/MHz | 9.91kPixels/s/MHz |
多媒体浮点数 x1 .NET | 7.4MPixel/s | 13.65MPixel/s |
多媒体浮点数 x1 .NET vs SPEED | 2.18kPixels/s/MHz | 3.60kPixels/s/MHz |
多媒体双精度 x1 .NET | 14.66MPixel/s | 27MPixel/s |
多媒体双精度 x1 .NET vs SPEED | 4.32kPixels/s/MHz | 7.12kPixels/s/MHz |
Sisoftware Sandra 2011测试中出现了一个很奇怪的现象,如果仅仅看测试数据,或许你会认为这是单路与双路服务器的比较,因为诸多项目中两者的差距都在50%以上。当然了,E3系列是不会有双路的,我们对比的都是单路塔式服务器;而对于同样处于E3系列的产品有如此大的差距,考虑到两者的主频差距只有0.3GHz,我们相信更多的差距来自于超线程,要知道E3-1220可是没有超线程技术的。
SiSoftware Sandra Pro Business 2011 | ||
产品名称 | 联想T168 G7 | 方正LT200服务器 |
平台类型 | 单路Intel SandyBridge | 单路Intel SandyBridge |
Memory Bandwidth Benchmark 内存带宽测试 | ||
---|---|---|
总体内存性能 | 17GB/s | 17.6GB/s |
总体内存性能对比速度 | 13.11MB/sMHz | 13.53MB/sMHz |
整数 B/F iSSE2 内存带宽 | 17GB/s | 17.6GB/s |
整数 B/F iSSE2 内存带宽对比速度 | 13.11MB/sMHz | 13.53MB/sMHz |
整数 B/F iSSE2 内存带宽 | 17GB/s | 17.6GB/s |
整数 B/F iSSE2 内存带宽对比速度 | 13.09MB/sMHz | 13.52MB/sMHz |
Memory Latency Benchmark 内存延迟测试 | ||
内存延迟(越小越好) | 76.5ns | 73.8ns |
内存延迟对比速度 (越小越好) | 0.06 | 0.06 |
速度因素 (越小越好) | 64.10 | 68.40 |
内部数据高速缓存 | 4clocks | 4clocks |
二级板载高速缓存 | 11clocks | 11clocks |
三级板载高速缓存 | 36clocks | 35clocks |
Cache and Memory Benchmark 缓存及内存测试 | ||
缓存/内存带宽 | 89.84 GB/s | 97.42 GB/s |
缓存/内存带宽对比速度 | 7.12MB/s/MHz | 26.32MB/s/MHz |
速度因素(越小越好) | 36.50 | 36.70 |
内部数据高速缓存 | 384.63GB/s | 425.87GB/s |
二级板载高速缓存 | 325.66GB/s | 287GB/s |
三级板载高速缓存 | 164.23GB/s | 133.44GB/s |
内存测试的结果与处理器的主频关系不大,与内存容量的关系不大,只和内存的品质及通道模式有关。因此我们发现,这时候两台服务器的性能差距微乎其微,只是在缓存相关的项目中,方正略有优势。
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器。
虽然在之前的项目中,我们可以看到方正LT200服务器凭借着超线程的技术在性能上有了明显的突破,但是在CineBench测试中,除了多核心下性能明显超越联想T168 G7之外,单核心的性能并未见明显变化,更重要的是核心/线程数的提升较小。这只能说明CineBench对于线程的应用还没有实现最大化。
SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPEC CPU 2006是SPEC组织推出的一套CPU子系统评估软件,它包括CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能。计算系统中的处理器、内存和编译器都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2006的影响比较小。
SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。
为了运行SPEC CPU 2006测试,我们统一安装了Windows Server 2008 Enterprise x64 Edition SP1操作系统,在主流的x64处理器下,原生64应用要比32位下快。我们还安装了Visual Studio 2005 SP1、Intel C++/Fortran Compiler 10.0.025编译器,对于支持SSE3指令集的处理器,我们使用了QxO编译指令进行了优化。编译时未使用SmartHeap商业优化库。
SPEC测试代表了绝大多CPU密集型的运算,包括编程语言、压缩、人工智能、基因序列搜索、视频压缩及各种力学的计算等,包含了多种科学计算,可以用来衡量系统执行这些任务的快慢。SPEC base测试包括浮点(fp)与整数运算(int)两部分。
整数运算主要包含编译、压缩、人工智能、视频压缩转换、XML处理等,此外,各种日常操作也主要是基于整数操作。SPEC CPU 2006的整数运算包含了400.perlbench PERL编程语言、401.bzip2 压缩、403.gcc C编译器、429.mcf 组合优化、445.gobmk 人工智能:围棋、456.hmmer 基因序列搜索、458.sjeng 人工智能:国际象棋、462.libquantum 物理:量子计算、464.h264ref 视频压缩、471.omnetpp 离散事件仿真、473.astar 寻路算法、483.xalancbmk XML处理共12项。
SPEC CPU 2006整数测试成绩
浮点运算包括的全部都是科学运算,科学运算需要用到大量的高精度浮点数据,如410.bwaves 流体力学、416.gamess 量子化学、433.milc 量子力学、434.zeusmp 物理:计算流体力学、435.gromacs 生物化学/分子力学、436.cactusADM 物理:广义相对论、437.leslie3d 流体力学、444.namd 生物/分子、447.dealII 有限元分析、450.soplex 线形编程、优化、453.povray 影像光线追踪、454.calculix 结构力学、459.GemsFDTD 计算电磁学、465.tonto 量子化学、470.lbm 流体力学、481.wrf 天气预报、482.sphinx3 语音识别共17项测试。
SPEC CPU 2006浮点运算测试成绩
方正LT200服务器在测试中的表现非常出色,当然也这是可以理解的,毕竟它所搭配的E3处理器在主频和线程上都要强于联想T168 G7。不过我们也发现,整数性能测试中两者的差距较大,而浮点测试中的差距较小。看来同一个测试,不同项目对于主频的敏感程度也不同。
我们测试的方正LT200服务器采用了3块西部数据500GB SATA硬盘,通过板载的RAID卡,我们组建了RAID 5阵列。不过由于是软RAID,没有缓存和电池的支持,甚至连芯片组都是兼职工作的,所以性能表现并没有独立RAID卡那么稳定。
我们先来看看IOps的成绩。对比中我们发现,方正LT200服务器读写IOps都大大高于联想T168 G5。通过测试我们看到,在队列深度较浅的时候,联想T168 G7还有一定的优势,但随着队列深度的增加,软RAID的性能也不可小觑,最终的读写性能都大幅度超过了联想T168 G7。不过同时我们也发现,由于缺乏配套的硬件支持,读写性能的差距非常明显。
吞吐量测试再一次说明了上述问题。我们发现,方正LT200服务器的读取吞吐量峰值可以达到500MBps,而写入峰值只有130MBps,差距非常大。而且写入速度很不稳定,队列深度对于速度有着明显的影响,这也是软RAID与生俱来的弱势。
对于大部分塔式服务器的定位来说,满足中小企业的应用,特别是用于企业局域网内部的FTP服务器是很常见的。这样一来,也就是要考察服务器在文件处理中的应用表现。为此,我们针对联想T168 G7服务器进行了Netbench测试。这个测试主要反映被测服务器在用作文件服务器时所能提供的网络数据传输能力。
虽然联想T168 G7一直被方正LT200所压制,但当测试转换到了网络的时候,情况也发生了明显的变化。我们甚至在最初怀疑方正LT200是否进行过优化,但是多次测试之后结果依然停留在200 Mbps左右,看来还是硬件本身的问题。究其原因,方正LT200采用的是单网口,在网络负载较大的时候吞吐量受到了明显的压制;而联想T168 G7的双网口则好得多,不仅仅可以实现分工,我们所绑定的Teaming功能也可以保证带宽的成倍提升。所以才出现了图中的情况。当然,大部分塔式服务器来说,单网口的配置也不在少数,在以后的测试中我们还会遇到类似的产品。
我们利用UNI-T UT71E智能数字万用表和相配套的软件对于对于被测服务器在几种不同的状态下的功耗进行了监测,主要包括如下项目:
P1:连接电源但不开机状态
P2:系统启动完毕,5分钟内无动作,但不休眠
P3:系统启动完毕,处理器满载、磁盘以最大吞吐量工作
有一个问题是需要我们注意的——方正LT200搭配的处理器、内存、硬盘等诸多硬件的功耗都比联想T168 G7高很多,特别是硬盘功耗还是很大的。但在测试中我们却发现,方正LT200在各种状态下都比联想T168 G7的功耗更低。这其中一个主要原因是电源。方正LT200所使用的是80PLUS认证的铜牌电源,而联想只是用的是普通的台达电源。这个对比也告诉我们,如果想要低功耗,电源的配置及处理器都是很关键的内容。
在每款横评过的服务器之后,我们都要对产品进行一番总结。这次我们测试的方正圆明LT200服务器是方正与宏碁合作之后的新产品,主要定位在中小市场,特别是政府应用。许多人恐怕都对方正的服务器比较陌生,相比其他通用服务器厂商来说,方正主要方向是在行政市场,在消费市场声音比较小也就不奇怪了。
方正圆明LT200服务器
本次测试的方正圆明LT200服务器首先给我们的感觉是较小的体积,相比普通的塔式服务器来说更为袖珍,如果按照规格来看算是小塔式。这个体积的好处是可以方便的放置在办公室中,加上超低的静音设置,方正圆明LT200服务器完全可以适用于办公环境,无需额外的机房。
我们将方正圆明LT200服务器与之前测试的联想T168 G7进行了对比。由于方正圆明LT200服务器本身的配置较高,所以在多数项目中均领先于对比平台;只是受限于网络接口的原因,在文件服务器的测试中表现落后,这也是许多塔式服务器都会遇到的问题。
让人遗憾的是由于方正与宏碁的合作还未能足够深入,所以方正圆明LT200服务器还没有成型的软件可供测试,在未来方正将计划开发一键式无人值守安装系统,只是不知道未来究竟是一个多大的概念。至少从现在来看,方正圆明LT200服务器的表现还是不错的,静音设计也很出色,能看得出针对塔式服务器的应用环境进行了优化。