【IT168 评测】惠普刀片服务器从硬件本身的设计理念与产品阵容,到产品配置的先进性与出众的性能表现,再到具体的现实应用以及未来的基础架构融合发展方向,这也使惠普刀片服务器得以长期保持着王者风范。本次我们评测的惠普ProLiant BL465c G7服务器采用了双路Magny-Cours处理器,提供了24个物理核心。
惠普ProLiant BL465c G7服务器
在我们传统的印象中,刀片服务器由于其技术与成本的原因,一般情况下都是被大型企业采用。但是近年来,随着虚拟化与云计算的发展,特别是随着中小企业采购成本与升级问题的困扰,原来越多的中小企业也开始尝试使用刀片服务器。其实从投资及可持续发展的角度来说,采购刀片服务器虽然在短时间内的成本比机架或塔式服务器高一些,但由于升级潜力好,刀片服务器实际的后期维护与升级成本并不高,而且其使用寿命也更长。对于中小企业来说,如果着眼于长远的发展的话,那么刀片服务器依然是一个不错的选择。
本次我们评测的惠普ProLiant BL465c G7服务器具备出色的性能、可升级性和可扩展性,成为数据中心计算的标准。BL465c可以在一个半高刀片内,插入2个处理器、2块热插拔硬盘、192 GB内存以及1个双端口FlexFabric适配器,可以为用户提供满足各种业务应用的出色平台。
插满刀片的惠普C7000机箱
与送测刀片相对应,惠普本次搭配的是C7000机箱。它带有一个3英寸的LCD显示屏,可以显示机箱及其组件的状态信息,提高了易用性。该机箱还附带有刀片洞察管理软件包,不仅可以用来管理物理及虚拟系统,还能测量和管理机箱的功耗。性能方面,C7000最多支持8台全高刀片或16台半高刀片,刀片可配置英特尔至强、安腾或AMD处理器,可支持当前及未来的I/O连接惠普虚拟连接技术可减少安装、配置和重配置网络及SAN组件的时间。
刀片服务器相比我们平时看到的塔式或机架产品最大的不同就是组要额外对于机箱本身进行配置。以我们本次看到的C7000机箱为例,我们下面就要介绍如何为机箱设定IP地址。
在Enclosure Settings设置中,我们需要为机箱提供一个静态的IP地址,这里只能选择DHCP自动分配或者静态分配。如图,我们将IP地址设置为了192.168.0.100。
同时,用户还可以手动调节默认的IP地址,在设置完成之后点击Accept就可以保存了。
在设置了IP地址之后,我们就可以进入服务器内部进行基本参数的调配了。这时候,我们需要通过网线,用远程桌面登录到服务器本身,同样也就是我们刚刚设置的IP上。
登录界面的样子
进入之后可以看到当前机箱的工作状态
时间和日期调节
静态IP调节
IP地址调配
VLAN设置
一台传统刀片服务器的配置通常需要一个双端口LOM、一个额外的四端口网卡中间件、一个双端口HBA及交换机模块(6个以太网和2个光纤通道)。传统配置组件总数可达40个,而VC FlexFabric模块解决方案仅需少数几个。VC FlexFabric解决方案仅需要服务器内置的双端口FlexFabric适配器(无夹层卡)和2个VC FlexFabric模块。(40-2)/40=95%,这一简便的算法有助于你更好的理解。
服务器边缘是当今有关基础设施的最为复杂的领域之一,承担着最多的服务器到服务器流量,因而经常出现拥塞状况。随着虚拟服务器和应用需求及各种网络连接需求的不断增长,线缆、适配器卡、交换机、特殊软件和管理流程得数量也不断增加,几乎到了难以控制的地步。Virtual Connect (VC) FlexFabric模块可通过一种全新的方法来解决这一问题,即:使用融合和虚拟化基础设施取代传统交换机和模块,使用一条线缆和一个设备即可将服务器连接到任意网络。
如果一个服务器网络端口可提供四个物理连接,因而可实现对每个应用程序或虚拟服务器需要的带宽的精确控制,您会作何感想!如果您可以创建并存储服务器的LAN或SAN连接配置文件,并且可以将配置文件应用到数据中心任意位置的另一台服务器,同时无需连接线缆,无需更改设置或进行网络设置,完成所有这些仅需轻点几下鼠标即可,您会作何感想?如果每次添加、移动或更换服务器时,仅需将服务器插入并启动,即可运行基础设施,您会作何感想?如果您可以使用熟悉的行业标准完成全部工作,并可以进行集中管理,从而大幅减少工作量,您又会作何感想呢?
全新Virtual Connect FlexFabric模块和FlexFabric适配器可通过独特且异常轻松的方式,让系统管理员能够独立完成更多工作。他们可随意迁移工作负载,添加、移动或更换刀片服务器,且无需改动网络设置,无需每一步都有多名管理域方面的专家参与。
作为第一种专为满足融合基础设施需求而设计的互连技术,Virtual Connect FlexFabric模块只使用一个互连,无需中间件,即可通过以太网、光纤通道和iSCSI协议,将服务器和虚拟机连接到数据和存储网络。然后在数分钟内(而不是几天内)添加、移动或更换这些连接。VirtualConnect FlexFabric模块也基于独特的Virtual ConnectFlex-10功能,可分配并精确调整数据和存储连接的网络带宽,以确保每个连接的带宽配置正好满足需求。
在成功配置C7000机箱之后,我们将要对ProLiant BL465c G7服务器进行一番介绍。
ProLiant BL465c G7内部结构
惠普ProLiant BL465c G7服务器的内部非常紧凑,前后排列了双路处理器和内存模块,磁盘阵列卡和扩展卡被放在了服务器的后方。
皓龙6174处理器
这是ProLiant BL465c G7服务器所使用的皓龙6174处理器,隶属于上一代的马尼库尔系列。这个系列处理器的最大特点是支持12个物理核心,皓龙6174就是如此。而且它还提供了2.2GHz主频,基于K10 Greyhound+增强型架构,由GlobalFoundries采用45nm SOI工艺制造,每个核心搭配512KB二级缓存,每六个核心共享6MB三级缓存、总计12MB,整个处理器拥有四条速度为6.4GT/s的HT 3.0总线,以及DDR3-1333内存控制器。
ProLiant BL465c G7搭配的内存
被测的惠普ProLiant BL465c G7服务器搭配了12条单条容量为4GB DDR3内存,总内存容量达到了48GB。对于我们的测试来说,这个容量仅仅是够用而已。
双层磁盘设计
两块来自HP的6Gbps硬盘
ProLiant BL465c G7比较特殊的地方在于磁盘的空间设计。由于刀片服务器的空间较小,ProLiant BL465c G7使用了双层设计,有一个可升降的磁盘托架,可以安装2块2.5英寸的硬盘。
磁盘阵列卡
服务器内部的扩展槽
服务器扩展卡
用于虚拟化操作的内部USB接口和TF卡插槽
板载的显示芯片(右侧为配套显存)
惠普特色的iLO3芯片
对于服务器的测试,我们主要从产品满足用户应用的角度出发,分功能和性能两个方面来考察。其中性能测试主要体现的是服务器在提供特定服务时的具体的事务处理能力,而在功能上,主要反映的是服务器的可靠性、可扩展性以及易用性等方面的特征。另外,由于不论是最终用户还是处理器厂商,大家对于服务器的能耗问题都给以了很高的重视,为此,我们也继续将能耗作为考察服务器使用成本的重要指标。
▲网络测试环境
贴近应用的性能测试
在实际的应用中,不同的应用条件对于服务器子系统性能的要求也有一定的偏重,因此同一服务器在不同应用中所表现出的性能状况常会出现较大差异。为了能准确反映出服务器的性能状况,我们选择了Web、文件服务器和数据库等三种较为普遍的应用作为测试重点。之所以选用以上三种应用作为性能测试点,这几项应用相对较为普遍是原因之一,此外我们也考虑到这三种应用对于服务器子系统的要求也各有偏重,这样可以更全面的考察服务器各子系统的性能状况。
讲求实用的功能测试
可靠性、可扩展性和易用性同样也是用户关心的内容,但不同的用户对这三方面的需求会有所不同。比如一些中高端服务器产品,在应用中多采用专用机房或托管方式,这时其易用性中的可管理性方面就显得非常重要,远程管理会让工程师及时了解服务器工作状况,实现及时有效的管理和维护。而对于入门级服务器来说,由于很多用户会随着业务的增长会对其处理能力、存储容量有进一步的要求,这时其可扩展性就显得更为重要。可靠性是服务器的一个关键特性,它反映了服务器在应用过程中系统能否确保长时间正常工作,这也是服务器与普通PC之间的重要区别。对于以上三个方面,我们都制定了详细项目进行逐一考察。
兼顾使用成本的能效测试
服务器的售价反映的它是一次性的购买成本,而后期的使用成本是一个不容小视的问题,作为一个要求7×24连续工作的设备,它所产生的电费将是一笔不小的开销。实际上在评判服务器的运算能力时,一定不能将功耗问题视而不见,性能功耗比是衡量服务器运算效能的一个重要指标,测试中我们利用功率分析仪对服务器在加电关机、开机空载以及满负载三种状态下的功耗进行测定,为服务器的能效以及使用成本的估算提供数据支持。
为了进行网络产品的测试,IT168评测中心专门组建了网络实验室,并搭建了一个有60台客户端的网络测试环境,通过控制端并利用专业的网络测试软件,可以构建出多样化的网络访问模型,能够产生真实的多用户网络应用环境。可以对服务器类设备进行不同应用下的高压力性能测试,以直观的结果反映出服务器产品在用于不同应用时其真实的性能状况。
我们采用Cisco Catalyst 4506千兆交换机作为测试环境的交换设备,60台客户端采用的是DELL PowerEdge SC430以及DELL PowerEdge T100两种塔式的单路服务器,能产生足够大的网络访问压力,因而可以测试服务器类设备在实现不同应用时的极限性能。
▲网络实验室控制台
▲Cisco Catalyst 4506千兆交换机,120个千兆网口
▲用于产生用户访问压力的Dell PowerEdge SC430服务器
对于服务器性能方面的考察,我们主要分为子系统测试和应用性能测试。在子系统测试中我们按处理器、内存以及磁盘等各个子系统进行了分项测试,当然各子系统的测试成绩也是相辅相成,也需要其它子系统的支持,并非是完全独立的,只是对考察的子系统有所偏重而已。
- 处理器子系统测试
对服务器处理器子系统的考察,我们主要采用的是业界公认的SPEC CPU 2006测试,该项测试通过对数十个典型应用程序的运行,来测试系统处理器子系统在应用中的整、浮点运算效率。SPEC CPU 2006测试具有很好的开放性,因此在业界为广大用户所接受,可以利用这一公开的测试结果进行系统间运算性能的比较。
此外SiSoftware Sandra也有测试子项可用于处理器运算性能测试,其结果通常以每秒完成的指令数来表现。也可以用作不同处理器间运算效率的比较。
SPEC CPU 2006 v1.1
SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPEC CPU 2006是SPEC组织推出的CPU子系统评估软件最新版,我们之前使用的是SPEC CPU 2000。和上一个版本一样,SPEC CPU 2006包括了CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,后者则用于测量和对比浮点性能,SPEC CPU 2006中对SPEC CPU 2000中的一些测试进行了升级,并抛弃/加入了一些测试,因此两个版本测试得分并没有可比较性。
SPEC CPU测试中,测试系统的处理器、内存子系统和使用到的编译器(SPEC CPU提供的是源代码,并且允许测试用户进行一定的编译优化)都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2006的影响非常的小。
SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。
我们在被测服务器中安装了Intel C++ 11.1.034 Compiler、Intel Fortran 11.1.034 Compiler这两款SPEC CPU 2006必需的编译器,通过最新出现的QxS编译参数,Intel Compiler 10版本开始支持对Intel SSE4指令集进行优化(假如只支持SSE3,则使用QxT编译参数)。我们另外安装了Microsoft Visual Studio 2003 SP1提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,使用了较多的编译选项。我们根据被测系统选择实际可同时处理的线程数量,最后得到SPEC rate base测试结果(基于base标准编译,SPEC base rate测试代表系统同时处理多个任务的能力)。
和其它测试部件不同,SPEC CPU 2006需要大量的系统物理内存,我们的SPEC测试在64位的Windows Server 2008 R2 下完成,对于每个运算核心,最低配置1.5GB内存。
- 内存子系统测试
对于内存子系统的考察,也是利用SiSoftware Sandra来实现,在该软件中有相应组件可进行内存带宽、内存延迟等方面的测试。
SiSoftware Sandra v2010
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。从2007开始,Sandra的Arithmetic benchmarks增加了对SSE3&SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一,SiSoftware Sandra 2010对NUMA架构以及最新的Windows 7/Windows Server 2008 R2提供了更好的支持,此外测试项目和测试结果也有了略微的变化。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。
- 存储子系统测试
对存储子系统的考察,是利用IOMeter这一软件来完成。
IOMeter 2006.07.27
IOMeter是一款功能非常强大的IO测试软件,它除了可以在本机运行测试本机的磁盘IO性能之外,还提供了模拟网络应用的能力。为了大家能更好的通过我们的测试数据进行不同系统之间的对比,我们在测试中都使用相同的脚本。其中的最大IO能力的测试中我们所采用的了数据块大小为512B,100%读取操作,随机率为0%。而另一测试数据块大小则选择了64KB,100%读取操作,随机率为0%,用于检测磁盘系统的最大吞吐量。
服务器平台信息 | |
产品名称 | 惠普ProLiant BL465c G7服务器 |
平台类型 | 双路AMD Opteron 6174 |
处理器子系统 | |
---|---|
处理器型号 | AMD Opteron 6174 |
处理器架构 | AMD 45nm Magny-Cours |
代号 | Magny-Cours |
处理器封装 | Socket G34 |
核心/线程数量 | 8/8 |
主频 | 2.2GHz |
处理器指令集 | MMX,SSE,SSE2,SSE3, |
外部总线 | 2600MHz |
L1 Code Cache | 12x 64KB 2路集合关联 |
L1 Data Cache | 12x 64KB 2路集合关联 |
L2 Cache | 12x 512KB 16路集合关联 |
L3 Cache | 10MB 96路集合关联 |
服务器主板 | |
主板型号 | ProLiant BL465c G7 |
主板芯片组 | AMD SR5690+AMD ID439D |
北桥芯片特性 | - |
内存子系统 | |
内存控制器 | 每CPU集成四通道Unganged DDR3 1333 |
内存类型 | 4GB R-ECC DDR3 1333 SDRAM x12 |
存储子系统 | |
磁盘控制器 | HP P410i RAID |
磁盘控制器规格 | P410i RAID 8× SAS 6Gbps Hardware RAID 0/1/ |
控制器驱动 | LSI MegaSR 13.06.0212.2009 |
硬盘型号数量 | Seagate Savvio 10K.3 |
硬盘规格 | 10000RPM 146GB SAS 6Gbps 16MB Cache |
软件环境 | |
操作系统 | Microsoft Windows Server 2008 Enterprise R2 x64 |
这里有个好玩的地方——为什么皓龙6174原本带有12MB的三级缓存,但是系统中却只能显示为10MB呢?我们在下一页揭晓答案。
Opteron 6174处理器,采用的还是上一代的45nm工艺,提供了12个核心,主频较低,只有2.2GHz
10MB共享三级缓存,太醒目了
现在,问题来了——在我们的印象及AMD的官方说明中,12核心的Opteron 6100系列都是12MB缓存的,但是这里为什么变成了10MB呢?是软件识别错误还是其他的什么原因?
在主板的设置选项中,有一个名为HT Assist的功能,全称为Hyper Transport(HT) Assist。HT Assist需要保留1MB三级缓存作为一个目录,用于跟踪系统其它地方使用的缓存行。这样,即使三级缓存只剩下了5MB,却省去了大量的探测传输,可以明显提升性能。而在本次评测的Opteron 6174主板上,我们又看到了这项功能。因为这项功能对于提升系统性能是大有帮助的,所以我们开启了它。
但是,开启之后的代价也是明显的。由于12核心的Magny-Cours源自6核心的Istanbul,事实上是将两颗Istanbul封装在一起而进行优化,所以当我们开启HT Assist功能的时候,每6MB三级缓存(也就是Istanbul的缓存)就要分配1MB给HT Assist,从而造成了12MB缓存只有10MB的局面。
一共有80GB的内存,这里只能显示出双通道
16个内存插槽,最大支持内存容量为512GB
AMD芯片组
Sisoftware Sandra 2011是最新版的Sisoftware Sandra测试软件,只所以选择这款软件是因为只有它能够实现对于至强E3处理器的测试,而老版本的2010则完全不能运行。虽然我们测试使用的是Lite版本,但是并不影响对于性能的考量。
SiSoftware Sandra Pro Business 2011 | |
产品名称 | 惠普ProLiant BL465c G7 |
平台类型 | 双路AMD Magny-Cours |
Processor Arithmetic Benchmark 处理器算术运算测试 | |
---|---|
总计本地功效 | 117.18GOPS |
总计本地功效对比速度 | 53.26MOPS/MHz |
Dhrystone iSSE4.2 | 136GIPS |
Dhrystone iSSE4.2 vs SPEED | 61.80MIPS/MHz |
Whetstone iSSE3 | 101GFLOPS |
Dhrystone iSSE3 vs SPEED | 45.90MFLOPS/MHz |
Processor Multi-Media Benchmark 处理器多媒体测试 | |
总计多媒体功效 | 194MPixel/s |
总计多媒体功效测试结果 | 75.43GOPS |
Multi-Media Int x16 iSSE4.1 | 151.45MPixel/s |
Multi-Media Int x16 iSSE4.1 vs SPEED | 58.9kPixels/s/MHz |
Multi-Media Float x8 iSSE2 | 248.49MPixel/s |
Multi-Media Float x8 iSSE2 vs SPEED | 96.63kPixels/s/MHz |
Multi-Media Double x4 iSSE2 | 135.76MPixel/s |
Multi-Media Double x4 iSSE2 vs SPEED | 52.79kPixels/s/MHz |
Multi-Core Efficiency Benchmark 处理器效能测试 | |
内联核带宽 | 5.46GB/s |
内联核带宽对比速度 | 2.54MB/s/MHz |
内联核延迟(越小越好) | 253.5ns |
内联核延迟对比速度(越小越好) | 1.15ns/MHz |
Java算数性能测试 | |
总计 Java 功效 | 81.7GOPS |
总计 Java 功效对比速度 | 37.13MOPSMHz |
Dhrystone Java | 123.22GIPS |
Dhrystone Java对比速度 | 56.01GFLOPS |
Whetstone Java | 54.16MIPSMHz |
Whetstone Java对比速度 | 24.62MFLOPSMHz |
Java多媒体性能测试 | |
总计多媒体Java功效 | 45.12MPixel/s |
总计多媒体Java功效对比速度 | 20.51kPixels/s/MHz |
多媒体整数 x1 Java | 47.47MPixel/s |
多媒体整数 x1 Java对比速度 | 21.58kPixels/s/MHz |
多媒体浮点数 x1 Java | 42.88MPixel/s |
多媒体浮点数 x1 Java对比速度 | 19.49kPixels/s/MHz |
多媒体双精度 x1 Java | 43MPixel/s |
多媒体双精度 x1 Java对比速度 | 19.53kPixels/s/MHz |
.NET Arithmetic Benchmark .NET算术运算测试 | |
总计 .NET 功效 | 48.56GOPS |
总计 .NET 功效对比速度 | 22.07MOPSMHz |
Dhrystone .NET | 45.77GIPS |
Dhrystone .NET vs SPEED | 20.80MIPS/MHz |
Whetstone .NET | 51.53GFLOPS |
Whetstone .NET vs SPEED | 23.42MFLOPS/MHz |
.NET Multi-Media Benchmark .NET多媒体测试 | |
总计多媒体.NET功效 | 25.88MPixel/s |
总计多媒体.NET功效对比速度 | 11.76kPixels/MHz |
多媒体整数 x1 .NET | 61.4MPixel/s |
多媒体整数x1 .NET vs SPEED | 27.91kPixels/s/MHz |
多媒体浮点数 x1 .NET | 11MPixel/s |
多媒体浮点数 x1 .NET vs SPEED | 4.96kPixels/s/MHz |
多媒体双精度 x1 .NET | 35.37MPixel/s |
多媒体双精度 x1 .NET vs SPEED | 16.08kPixels/s/MHz |
Sisoftware Sandra 2011增加了许多测试项目,主要是在单项整体性能上进行了总结,这是之前的版本所不具备的。
SiSoftware Sandra Pro Business 2011 | |
产品名称 | 惠普ProLiant BL465c G7 |
平台类型 | 双路AMD Magny-Cours |
Memory Bandwidth Benchmark 内存带宽测试 | |
---|---|
总体内存性能 | 26GB/s |
总体内存性能对比速度 | 20.01MB/sMHz |
整数 B/F iSSE2 内存带宽 | 22.25GB/s |
整数 B/F iSSE2 内存带宽对比速度 | 17.08MB/sMHz |
整数 B/F iSSE2 内存带宽 | 30.54GB/s |
整数 B/F iSSE2 内存带宽对比速度 | 23.44MB/sMHz |
Memory Latency Benchmark 内存延迟测试 | |
内存延迟(越小越好) | 92.4ns |
内存延迟对比速度 (越小越好) | 0.07 |
速度因素 (越小越好) | 67.60 |
内部数据高速缓存 | 3clocks |
二级板载高速缓存 | 16clocks |
三级板载高速缓存 | 57clocks |
Cache and Memory Benchmark 缓存及内存测试 | |
缓存/内存带宽 | 220.14GB/s |
缓存/内存带宽对比速度 | 7.12MB/s/MHz |
速度因素(越小越好) | 20.80 |
内部数据高速缓存 | 654.67GB/s |
二级板载高速缓存 | 259.37GB/s |
三级板载高速缓存 | 102.47GB/s |
。
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。
AMD Opteron 6172的单核心成绩只有0.66 pts,多核心性能为9.92 pts,MP Ratio值为15,趋紧于核心数目。在这一代的产品中,AMD还没有超线程技术,因此成绩看起来比较低;从下一代推土机开始,多线程的引入或许会让性能得到大幅度提升。
我们的测试服务器采用了2块希捷ST9146803SS硬盘组建了RAID 0阵列,使用的是服务器自带的P410i阵列卡。2.5英寸硬盘虽然在转速上并非是目前最快的,但是它却可以提供更好的IOps。
ProLiant BL465c G7服务器的成绩非常不错,我们测试的IOps读写成绩都接近10W,MBps测试成绩达到了1300Mbps。这个成绩是非常不错的,得益于RAID 0阵列。
SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPEC CPU 2006是SPEC组织推出的一套CPU子系统评估软件,它包括CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,而后者则用于测量和对比浮点性能。计算系统中的处理器、内存和编译器都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2006的影响比较小。
SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、DCC以及科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。
为了运行SPEC CPU 2006测试,我们统一安装了Windows Server 2008 Enterprise x64 Edition SP1操作系统,在主流的x64处理器下,原生64应用要比32位下快。我们还安装了Visual Studio 2005 SP1、Intel C++/Fortran Compiler 10.0.025编译器,对于支持SSE3指令集的处理器,我们使用了QxO编译指令进行了优化。编译时未使用SmartHeap商业优化库。
SPEC测试代表了绝大多CPU密集型的运算,包括编程语言、压缩、人工智能、基因序列搜索、视频压缩及各种力学的计算等,包含了多种科学计算,可以用来衡量系统执行这些任务的快慢。SPEC base测试包括浮点(fp)与整数运算(int)两部分。
整数运算主要包含编译、压缩、人工智能、视频压缩转换、XML处理等,此外,各种日常操作也主要是基于整数操作。SPEC CPU 2006的整数运算包含了400.perlbench PERL编程语言、401.bzip2 压缩、403.gcc C编译器、429.mcf 组合优化、445.gobmk 人工智能:围棋、456.hmmer 基因序列搜索、458.sjeng 人工智能:国际象棋、462.libquantum 物理:量子计算、464.h264ref 视频压缩、471.omnetpp 离散事件仿真、473.astar 寻路算法、483.xalancbmk XML处理共12项。
SPEC CPU 2006整数测试成绩
浮点运算包括的全部都是科学运算,科学运算需要用到大量的高精度浮点数据,如410.bwaves 流体力学、416.gamess 量子化学、433.milc 量子力学、434.zeusmp 物理:计算流体力学、435.gromacs 生物化学/分子力学、436.cactusADM 物理:广义相对论、437.leslie3d 流体力学、444.namd 生物/分子、447.dealII 有限元分析、450.soplex 线形编程、优化、453.povray 影像光线追踪、454.calculix 结构力学、459.GemsFDTD 计算电磁学、465.tonto 量子化学、470.lbm 流体力学、481.wrf 天气预报、482.sphinx3 语音识别共17项测试。
▲SPEC CPU 2006浮点运算测试成绩
由于本次测试的惠普ProLiant BL465c G7服务器成绩非常出色,主要是因为物理核心数量多。
对于在网络环境中承担着计算和数据处理重任的服务器来说,性能提升是永恒的话题。不过,需要注意的是,这里提到的性能不仅仅是CPU的整数和浮点计算性能,也包括内存、I/O、存储和网络等子系统。毕竟,今天的应用负载呈现多样化的发展趋势,既有计算密集型的科学工程计算,内存密集型的虚拟化整合,也有众多频繁读写I/O的Web和事务交易型应用。因此,在采购通用型服务器时,需要着重考虑系统的“综合性能价格比”。
惠普BL465c G7服务器
在升级到G7系列之后,随着G34接口的出现,ProLiant G7几乎重新设计了整个平台。本次我们测试的Operton 6174就是一款12核心的处理器,提供了强大的核心处理能力。管理方面,iLO2升级到了ILO3让用户的操控更为简单。
我们的测试显示, 被测惠普BL465c G7服务器有着强大的处理器能力、丰富的内存带宽和高速的磁盘读写量,凭借这些优势,可以使其在实际的企业应用中充当中流砥柱的角色。不仅如此,惠普BL465c G7服务器作为刀片服务器,其升级和扩展能力也是非常出众,搭配C7000刀箱,可以实现最大16台半高刀片的扩容,为企业用户提供长期有效的保障。