服务器 频道

11款英特尔至强SandyBridge服务器横评

  【IT168 评测】今年4月初,英特尔对外发布了最新的基于Sandy Bridge微架构的32nm至强处理器——E3系列。虽然这并非是Intel第一次发布基于Sandy Bridge微架构的产品,虽然E3仅仅面向单路应用而生,但不管怎么说,E3的出现的确标志着Intel在至强处理器发展中迈出了重要的一步,也是Tick-Tock战略中重要的内容(Tock)。经过2011年全年的推广,至强E3已经成为了当今面向中小企业应用的单路服务器平台,本次2011-2012年度服务器横评中,我们也选择了至强E3平台作为评测方向。

Intel至强Sandy Bridge处理器首发评测
Intel发布Sandy Bridge微架构32nm至强处理器

  本次横评我们一共征集到了来自IBM、惠普、戴尔、富士通、中科曙光、联想、方正、宏碁、宝德等8个厂商的共11款产品,它们都基于至强E3服务器平台。从数量上说,这是IT168在近几年进行的最大规模横评,基本囊括了所有主流品牌在内,也使得本次横评的参考性和权威性大大提升。

  得益于桌面级Sandy Bridge处理器的成功,许多人对于至强Sandy Brideg处理器也充满了期待。虽然对于至强处理器应用的服务器环境来说,多媒体性能并非是人们应该关注的内容。而每当提到Sandy Bridge的技术特点——环形总线、AVX指令集、Turbo Boost2等内容都是众多报道中频繁出现的内容。

  下面,我们先从至强E3处理器的SandyBridge微架构开始说起,慢慢进入本次横评正式内容。

英特尔Sandy Bridge至强处理器路线图

  按照Intel著名的时钟规律——Tick-Tock来看,Sandy Bridge明显属于后者,也就是Tock范畴。Tock主要是指处理器微架构方面的改变,而核心工艺的上一次升级已经由我们熟悉的Westmere完成了,下一次22nm的升级还要再等等才行。

  在进行系统的分析之前,我们先来看看最新的至强Sandy Bridge处理器路线图。相比以往的产品来说,Sandy Bridge至强处理器采用了与桌面级酷睿处理器类似的命名规范,分为E3、E5和E7三个系列。其中,E3系列是面向入门级单路服务器的产品,E5系列则面对了主流的双路服务器平台。唯一有特点的是E7,这款产品虽然在型号上采用了新的命名规则,但是在本质上E7还是上一代架构的产品,它还有一个大家非常熟悉的名字——Westmere-EX 。

英特尔Sandy Bridge至强处理器路线图
至强处理器路线图

  本次我们要介绍的至强E3系列属于面向单路服务器应用的产品,使用的是LGA115接口,也就是图中的Sandy Bridge-DT。按照产品布局分析,Sandy Bridge-DT主要定位在入门级的单路服务器,虽然同样是单路,但是高端应用的任务则是由Sandy Bridge-EN来承担。

  正如我们刚才提到的,新一代的至强Sandy Bridge处理器给我们带来的一个印象就是采用了环形总线架构,这也是Intel在继Nehalem和Westmere之后继续使用环形总线的架构。

新一代的环形总线,不一样的核外架构
Sandy Bridge核外架构图

  Sandy Bridge处理器使用了新的环形总线设计。事实上从之前的Nehalem开始,Intel就转向了融合核心的理念。在Nehalem当中,Intel将内存控制器融入其中,而在接下来的Westmere当中,GPU也作为融入的对象而出现(只是那时候的GPU还仅仅使用的是45nm工艺)。在之前的8核心Nehalem-EX上,我们就看到了环形总线的身影,不过当时的产品在性能和功耗上并没有表现出明显的优势。

新一代的环形总线,不一样的风景

  本次Sandy Bridge使用的是重新设计的核外结构,全新的Ring Bus环形总线更能够较好的展示出Sandy Bridge的真实性能。通过上图大家可以看到,Ring Bus环形总线连接各个CPU核心、LLC缓存(L3缓存)、融合进去的GPU以及System Agent(系统北桥)等部分。

新一代的环形总线,不一样的风景

  这个图片或许可以更好的说明问题。新的Ring Bus环形总线由四条独立的环组成,分别是数据环Data Ring、请求环Request Ring、响应环Acknowledge Ring和侦听环Snoop Ring。借助于环形总线,CPU与GPU可以共享LLC缓存,将大幅度提升GPU性能。

  在这个环形总线上,分布着多个Ring Stop,也就是俗称的“站台”。这个“站台”在每个CPU/LLC块上具有两个连接点,而之前使用环形总线的产品,也就是Nehalem-EX环在每个CPU/LLC块上只有一个连接点。

  环形总线的存在,可以大大减少核心访问三级缓存的周期。在以往的产品中,多个核心共享一个三级缓存,需要访问的话必须先经过流水线发送请求,在进行优先级排序之后才能进行。新的环形总线将三级缓存分割成了若干部分,借助于每个站台,核心可以快速的访问LLC。LLC小容量缓存的延迟优势与核心频率一致性在这里也就体现了出来,这就使得Sandy Bridge的周期相比以往产品有所缩减,从原来的35-40个缩减到了26-31个。同时,由于每个核心与LLC之间可以提供若干带宽,使得Sandy Bridge的整体带宽也提升了4倍。

  在Sandy Bridge处理器中,Intel使用了一个全新的概念——System Agent(系统助手)。事实上,System Agent也就是我们之前所说的核外架构,只是Intel本次给予了其全新的命名,而在以往的名称中,我们亲切的称之为系统北桥。

比智能更智能SandyBridge架构全解析
系统助手

  System Agent包含了比以往产品更为丰富的功能,包括整合内存控制器、支持16条PCIE2.0通道的PCIE控制器、图形处理器(GPU)、电源控制单元(PCU)以及DMI总线的IO接口。

  PCI-E控制器,可提供16条PCI-E 2.0信道,支持单条PCI-E x16或者两条PCI-E x8插槽;

  重新设计的双通道DDR3内存控制器,内存延迟也恢复了正常水平(Westmere将内存控制器移出CPU、放到了GPU上);

  此外还有DMI总线接口、显示引擎、电源控制单元(PCU)。

  系统助手的频率要低于其他部分,有自己独立的电源层。

  在Sandy Bridge处理器中,最大的改进要算是增加了全新的AVX指令集——Advanced Vector Extensions,高级矢量扩展。这个指令集的增加是X86处理器中的重要内容,不仅仅是提供了更为良好的性能,同时也是对现有指令集的整合与优化。

  介绍AVX指令集之前,先要引入一个向量的概念。所谓向量,就是多个标量的组合,通常意味着SIMD(单指令多数据),就是一个指令同时对多个数据进行处理,达到很大的吞吐量。早在1996年,Intel就在X86架构上应用了MMX(多媒体扩展)指令集,那时候还仅仅是64位向量。到了1999年,SSE(流式SIMD扩展)指令集出现了,这时候的向量提升到了128位。

  如今,Sandy Bridge的AVX将向量化宽度扩展到了256位,原有的16个128位XMM寄存器扩充为256位的YMM寄存器,可以同时处理8个单精度浮点数和4个双精度浮点数。换句话说,Sandy Bridge的浮点吞吐能力可以达到前代的两倍。不过现在,AVX的256位向量还仅仅能够支持浮点运算。不过AVX的特别之处在于,它可以应用128位的SIMD整数和SIMD浮点路径。

 
  AVX指令集是和Sandy Bridge微架构紧密结合的,因此,微架构的浮点寄存器也要从128位扩展到256位,此外,Load单元也要适应一次载入256位的能力,Sandy Bridge没有直接扩展原有Load单元的位宽,而是通过增加了一个Load单元来达到256bit Load的能力。
 

 
  在进行新性能扩展的同时,AVX指令集的出现对于原有的X86指令集也进行了优化与重新组合——这主要源于AVX指令集新的操作码编码方式。AVX指令集的编码方式叫做VEX(Vector Extension),其主要用途是缩短指令长度,降低无谓的代码冗余,并且也降低了对解码器的压力,实现的方式也很特别——压缩各式各样的Prefix前缀,集中到一个比较固定的字段中,从而达到了精简指令集的目的。 

  既然我们一直在讨论Sandy Bridge核心,那么不谈到其特色的整合GPU显然是不合适的,虽然对于服务器的应用来说多媒体性能的确是无足轻重。其实我们在文章最初就提到过,作为Tioc-Tock时钟式的重要内容,其实从Wesrtmere 32nm处理器开始,Intel就在处理器中整合了GPU,不过仅仅是将二者封装在一个Die上。因为45nm的GPU与32nm的CPU在制程上不一致,最重要的是关键的内存控制器被放在了45nm的GPU当中,造成了32nm Westmere性能并没有想象的那么出色。而在Tock中,Sandy Bridge的出现解决了这一问题,特别是将GPU整合在了环形总线之内,实现了二者真正的融合。

革命性的整合GPU,32nm终成正果

  SandyBridge GPU有自己的电源岛和时钟域,也支持Turbo Boost技术,可以独立加速或降频,并共享三级缓存。显卡驱动会控制访问三级缓存的权限,甚至可以限制GPU使用多少缓存。将图形数据放在缓存里就不用绕道去遥远而“缓慢”的内存了,这对提升性能、降低功耗都大有裨益。

革命性的整合GPU,32nm终成正果

  可编程着色硬件被称为EU,包含着色器、核心、执行单元等,可以从多个线程双发射时取指令。内部ISA映射和绝大多数DX10.1 API指令一一对应,架构很像CISC,结果就是有效扩大了EU的宽度,IPC也显著提升。抽象数学运算由EU内的硬件负责,性能得以同步提高。

     Intel此前的图形架构中,寄存器文件都是即时重新分配的。如果一个线程需要的寄存器较少,剩余寄存器就会分配给其他线程。这样虽能节省核心面积,但也会限制性能,很多时候线程可能会面临没有寄存器可用的尴尬。在芯片组集成时代,每个线程平均64个寄存器,Westmere HD Graphics提高到平均80个,Sandybridge则每个线程固定为120个。

IBM X3250 M4服务器

IBM X3250 M4服务器评测总结
IBM X3250 M4服务器

  IBM X3250 M4服务器采用了1U机架式设计,布局简单,内部的通过导风罩散热,提供了热插拔硬盘和冗余电源,整体看来符合一台机架式服务器的标准定位。在我们测试的性能中,IBM X3250 M4服务器相比对比平台在处理器测试中性能提升了一倍以上,而借助于阵列卡的优势,它的磁盘性能非常突出,甚至可以说是我们本次横评中的佼佼者。

惠普ProLiant DL120 G7服务器

惠普ProLiant DL120 G7服务器评测总结
惠普ProLiant DL120 G7服务器

  本次我们评测的惠普ProLiant DL120 G7服务器是一台在1U密度下提供高性能计算的产品。相比同样应用E3处理器的平台来说,1U的高度相比塔式非常适合托管,当然这也只适合有独立机房的公司或者托管使用。相比之下,塔式服务器由于低噪音等优势,则可以应用在办公环境中,更适合小型的公司。

  惠普ProLiant DL120 G7服务器的设计比较简单,被测产品基于至强E3-1240处理器,搭配了16GB的内存,同时还配有P212阵列卡和4块硬盘,这在单路服务器中已经算是高端配置,关键部件可谓是应有尽有。

 惠普ML110 G7服务器

惠普ML110 G7服务器评测总结
惠普ML110 G7服务器

  惠普ML110 G7-一款定位于中小企业的入门级服务器,相比上一代产品增加了一个千兆网卡,对于文件服务器来讲是一个绝好的消息。服务器整体设计紧凑,而且从测试中我们也能看到,相同的配置下,ML110 G7性能会高出同类产品一截,对于空间紧张的中小企业是个不错的选择。

DELL T110 II服务器

DELL T110 II服务器评测总结
DELL T110 II服务器

  DELL T110 II服务器是一台应用于中小企业的单路塔式服务器,借助于最新Intel SandyBridge平台,何以满足中小企业用作文件服务器、数据库服务器等需求。可以作为企业应有的首台服务器,对于50人以下的中小企业尤其适合。

  本次我们测试的DELL T110 II服务器配置基于E3平台,但依然属于入门级。被测服务器采用了至强E3-1220处理器,搭配了8GB内存和250GB硬盘,没有提供阵列卡。就配置来说,被测服务器稍显低端,不过也正好迎合了入门级应用需求,作为企业购买的第一台服务器,DELL T110 II服务器显然是胜任的。

富士通TX120 S3服务器

富士通TX120 S3服务器评测总结
富士通TX120 S3服务器

  这是一台超瘦身的服务器,是一台设计精巧的产品,同时也意味着它的扩展功能会因此收到限制。本次我们测试的富士通TX120 S3服务器比较好的考虑到体积因素,但是我们认为这些对于服务器来说并非是最重要的。

  富士通TX120 S3服务器在设计上可以说是花费了不少的心思,包括设计和造型都很特别,我们第一次看到如此小巧的机型。通过测试,富士通TX120 S3服务器与我们对比的联想T168 G7不相上下,甚至在磁盘和功耗项目中的表现更好。但是整体来说,我们认为这台机器堪称是一款适合中小企业应用的产品,只是想升级的话需要花费点心思才行。

曙光I210r-G服务器

曙光I210r-G服务器测试总结
曙光I210r-G服务器

  曙光I210r-G服务器是一台1U规格的短身服务器,相比普通的1U服务器来说身材更小巧。同时,曙光I210r-G服务器提供了对于双硬盘的支持,实现了磁盘的冗余模式。在我们测试的过程中,曙光I210r-G服务器的表现让人满意,而且静音设计也不错,在节能方面有一定优势。

  曙光I210r-G服务器主要针对小型客户而定制,从我们测试的成绩来看,凭借高主频的优势,相比同类型的E3服务器来说,曙光I210r-G服务器的性能更出色,而且80Plus电源在节能方面也是首屈一指。从对比中我们可以看出,曙光I210r-G服务器在性能、功耗等方面的确比对比平台更出色。

联想T168 G7服务器

联想T168 G7服务器评测总结

  联想作为国内服务器的三巨头之一,首先从外观来看T168 G7的设计还是不错的,延续了T168系列一贯的风格,而且前置的热插拔硬盘也并非是所有国产厂商都具备的,这一点必须值得肯定。由于采用了全塔机箱,内部空间充足,散热也不是问题;尽管搭配了3个处理器和系统风扇,但是更大的尺寸有效降低了转速,噪音并不大,即便是放置在办公室也没有问题。

方正圆明LT200服务器

方正圆明LT200服务器评测总结
方正圆明LT200服务器

  方正宏碁合作之后的新产品,主要定位在中小市场,特别是政府应用。许多人恐怕都对方正的服务器比较陌生,相比其他通用服务器厂商来说,方正主要方向是在行政市场,在消费市场声音比较小也就不奇怪了。

  本次测试的方正圆明LT200服务器首先给我们的感觉是较小的体积,相比普通的塔式服务器来说更为袖珍,如果按照规格来看算是小塔式。这个体积的好处是可以方便的放置在办公室中,加上超低的静音设置,方正圆明LT200服务器完全可以适用于办公环境,无需额外的机房。

宏碁AC100服务器

宏碁AC100服务器测试总结
宏碁AC100服务器

  第一眼看到宏碁AC100的时候很容易被它小巧的身材所迷惑,笔者当时就误认为它与之前看过的联想D400或者话说TS MiNi一样属于家用NAS服务器的行列。事实上,宏碁AC100是一款彻彻底底的X86服务器,支持WIndows Server操作系统,与我们之前看到使用Home系统的所谓桌面服务器不可同日而语,更是比那些ARM架构的NAS强出百倍。

  之所以这么说,是因为宏碁AC100服务器的确能够实现通用式服务器的功能,包括我们服务器的任何常规测试它均可完成,而且在搭配了E3处理器之后,性能也不可小视。

宝德PR2280B服务器

宝德PR2280B服务器评测总结
宝德PR2280B服务器

  宝德PR2280B-一款定位于中小企业的入门级服务器,目前还未正式出货,跟我们之前介绍过的宝德PT6280B类似,内部空间很大,对于空间没有苛刻要求的企业应该说是个不错的选择,散热好,而且能够支持的存储量也够大,但是另一方面我们也发现了和PT6280B同样的情况,硬盘性能不足,相比联想T168 G7要低一大截。

宝德PT6280B服务器

宝德PR620B服务器评测总结
宝德PT6280B服务器

  这款定位于中小企业的服务器-宝德PT6280B目前还未正式上市,从我们的拆解、测试数据来看,还有几方面需要进一步改进,首先是整个机器的设计,拆解过程十分麻烦,这当中尤数硬盘,里外总共四个螺丝钉,十分不便;第二,空间利用率太低,偌大的机箱感觉太空旷,在这个什么都讲究节约的时代,显得有点脱节;第三、性能上的改进,当然在测试中,我们主要发现的是磁盘性能上的缺陷。

  对于服务器的测试,我们主要从产品满足用户应用的角度出发,分功能和性能两个方面来考察。其中性能测试主要体现的是服务器在提供特定服务时的具体的事务处理能力,而在功能上,主要反映的是服务器的可靠性、可扩展性以及易用性等方面的特征。另外,由于不论是最终用户还是处理器厂商,大家对于服务器的能耗问题都给以了很高的重视,为此,我们也继续将能耗作为考察服务器使用成本的重要指标。

服务器测试方法介绍
▲网络测试环境

  贴近应用的性能测试

  在实际的应用中,不同的应用条件对于服务器子系统性能的要求也有一定的偏重,因此同一服务器在不同应用中所表现出的性能状况常会出现较大差异。为了能准确反映出服务器的性能状况,我们选择了Web、文件服务器和数据库等三种较为普遍的应用作为测试重点。之所以选用以上三种应用作为性能测试点,这几项应用相对较为普遍是原因之一,此外我们也考虑到这三种应用对于服务器子系统的要求也各有偏重,这样可以更全面的考察服务器各子系统的性能状况。

  讲求实用的功能测试

  可靠性、可扩展性和易用性同样也是用户关心的内容,但不同的用户对这三方面的需求会有所不同。比如一些中高端服务器产品,在应用中多采用专用机房或托管方式,这时其易用性中的可管理性方面就显得非常重要,远程管理会让工程师及时了解服务器工作状况,实现及时有效的管理和维护。而对于入门级服务器来说,由于很多用户会随着业务的增长会对其处理能力、存储容量有进一步的要求,这时其可扩展性就显得更为重要。可靠性是服务器的一个关键特性,它反映了服务器在应用过程中系统能否确保长时间正常工作,这也是服务器与普通PC之间的重要区别。对于以上三个方面,我们都制定了详细项目进行逐一考察。

  兼顾使用成本的能效测试

  服务器的售价反映的它是一次性的购买成本,而后期的使用成本是一个不容小视的问题,作为一个要求7×24连续工作的设备,它所产生的电费将是一笔不小的开销。实际上在评判服务器的运算能力时,一定不能将功耗问题视而不见,性能功耗比是衡量服务器运算效能的一个重要指标,测试中我们利用功率分析仪对服务器在加电关机、开机空载以及满负载三种状态下的功耗进行测定,为服务器的能效以及使用成本的估算提供数据支持。

  为了进行网络产品的测试,IT168评测中心专门组建了网络实验室,并搭建了一个有60台客户端的网络测试环境,通过控制端并利用专业的网络测试软件,可以构建出多样化的网络访问模型,能够产生真实的多用户网络应用环境。可以对服务器类设备进行不同应用下的高压力性能测试,以直观的结果反映出服务器产品在用于不同应用时其真实的性能状况。

  我们采用千兆交换机作为测试环境的交换设备,60台单路服务器作为客户端,能产生足够大的网络访问压力,因而可以测试服务器类设备在实现不同应用时的极限性能。

服务器测试环境介绍
▲网络实验室控制台

服务器测试环境介绍
▲千兆交换机,120个千兆网口

服务器测试环境介绍
▲用于产生用户访问压力的塔式服务器

  对于服务器性能方面的考察,我们主要分为子系统测试和应用性能测试。在子系统测试中我们按处理器、内存以及磁盘等各个子系统进行了分项测试,当然各子系统的测试成绩也是相辅相成,也需要其它子系统的支持,并非是完全独立的,只是对考察的子系统有所偏重而已。

  处理器子系统测试

  对服务器处理器子系统的考察,我们主要采用的是业界公认的SPEC CPU 2006测试,该项测试通过对数十个典型应用程序的运行,来测试系统处理器子系统在应用中的整、浮点运算效率。SPEC CPU 2006测试具有很好的开放性,因此在业界为广大用户所接受,可以利用这一公开的测试结果进行系统间运算性能的比较。

  此外SiSoftware Sandra也有测试子项可用于处理器运算性能测试,其结果通常以每秒完成的指令数来表现。也可以用作不同处理器间运算效率的比较。

  SPEC CPU 2006 v1.1

  SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。

  SPEC CPU 2006是SPEC组织推出的CPU子系统评估软件最新版,我们之前使用的是SPEC CPU 2000。和上一个版本一样,SPEC CPU 2006包括了CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,后者则用于测量和对比浮点性能,SPEC CPU 2006中对SPEC CPU 2000中的一些测试进行了升级,并抛弃/加入了一些测试,因此两个版本测试得分并没有可比较性。

  SPEC CPU测试中,测试系统的处理器、内存子系统和使用到的编译器(SPEC CPU提供的是源代码,并且允许测试用户进行一定的编译优化)都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2006的影响非常的小。

  SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。

  我们在被测服务器中安装了Intel C++ 11.1.034 Compiler、Intel Fortran 11.1.034 Compiler这两款SPEC CPU 2006必需的编译器,通过最新出现的QxS编译参数,Intel Compiler 10版本开始支持对Intel SSE4指令集进行优化(假如只支持SSE3,则使用QxT编译参数)。我们另外安装了Microsoft Visual Studio 2005 SP1提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,使用了较多的编译选项。我们根据被测系统选择实际可同时处理的线程数量,最后得到SPEC rate base测试结果(基于base标准编译,SPEC base rate测试代表系统同时处理多个任务的能力)。

  和其它测试部件不同,SPEC CPU 2006需要大量的系统物理内存,我们的SPEC测试在64位的Windows Server 2008 R2 下完成,对于每个运算核心,最低配置1.5GB内存。

  内存子系统测试

  对于内存子系统的考察,也是利用SiSoftware Sandra来实现,在该软件中有相应组件可进行内存带宽、内存延迟等方面的测试。

  SiSoftware Sandra v2011

  SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。从2007开始,Sandra的Arithmetic benchmarks增加了对SSE3&SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一,SiSoftware Sandra 2011对NUMA架构以及最新的Windows 7/Windows Server 2008 R2提供了更好的支持,此外测试项目和测试结果也有了略微的变化。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。

  存储子系统测试

  对存储子系统的考察,是利用IOMeter这一软件来完成。

  IOMeter 2006.07.27

  IOMeter是一款功能非常强大的IO测试软件,它除了可以在本机运行测试本机的磁盘IO性能之外,还提供了模拟网络应用的能力。为了大家能更好的通过我们的测试数据进行不同系统之间的对比,我们在测试中都使用相同的脚本。其中的最大IO能力的测试中我们所采用的了数据块大小为512B,100%读取操作,随机率为0%。而另一测试数据块大小则选择了64KB,100%读取操作,随机率为0%,用于检测磁盘系统的最大吞吐量。

  网络应用性能测试

  应用性能测试则利用IT168的网络测试环境,模拟大量的客户端来实现对服务器进行访问,来测试服务器在提供文件服务器时的性能表现。

  NetBench 7.03性能测试

  NetBench是针对文件服务器的性能测试软件,影响NetBench性能的主要是服务器的磁盘子系统,这里所使用的磁盘RAID卡对于测试结果将会有明显的影响。测试中我们在被测服务器上设立了文件服务器,NetBench通过网络实验室中60个客户端来模拟网络中的PC向文件服务器所发出的文件传输请求,文件服务器则将存储在磁盘上的文件数据发送给相应的客户端。同Webbench测试一样,NetBench测试开始后客户端会以每四台一组依连接到服务器并发送文件传输请求。测试结束后控制台收集数据并绘制出服务器能够达到的数据传输变化曲线。

  CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器。

CineBench 11.5性能测试

  CineBench 11.5测试数据分为处理器和显卡两部分,这里我们选取的是处理器性能。基本上都测试ichengji来看,可以发现单核心成绩大多在1.3-1.4 pts之间,而多核心成绩差距比较大,分为4.0-5.0和6.0以上2个区间段。究其原因是多核心测试中许多处理器均提供了超线程功能(其实也只有E3-1220等少数E3处理器不支持超线程),从而引起了性能的差异化。这一点从MP Ratio中看得非常清楚。

  SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。

  整数运算主要包含编译、压缩、人工智能、视频压缩转换、XML处理等,此外,各种日常操作也主要是基于整数操作。SPEC CPU 2006的整数运算包含了400.perlbench PERL编程语言、401.bzip2 压缩、403.gcc C编译器、429.mcf 组合优化、445.gobmk 人工智能:围棋、456.hmmer 基因序列搜索、458.sjeng 人工智能:国际象棋、462.libquantum 物理:量子计算、464.h264ref 视频压缩、471.omnetpp 离散事件仿真、473.astar 寻路算法、483.xalancbmk XML处理共12项。

  浮点运算包括的全部都是科学运算,科学运算需要用到大量的高精度浮点数据,如410.bwaves 流体力学、416.gamess 量子化学、433.milc 量子力学、434.zeusmp 物理:计算流体力学、435.gromacs 生物化学/分子力学、436.cactusADM 物理:广义相对论、437.leslie3d 流体力学、444.namd 生物/分子、447.dealII 有限元分析、450.soplex 线形编程、优化、453.povray 影像光线追踪、454.calculix 结构力学、459.GemsFDTD 计算电磁学、465.tonto 量子化学、470.lbm 流体力学、481.wrf 天气预报、482.sphinx3 语音识别共17项测试。

SPEC CPU 2006处理器子系统性能测试

  SPEC测试更侧重于处理器硬件本身的性能。本次横评我们征集到的处理器型号主要为E3-1220、E3-1260L、E3-1270、E3-1280和E3-1290。基本上我们发现,浮点运算对于处理器的主频较为敏感,而整数运算对于处理器超线程则并不感冒。因为众多服务器的处理器基本相同,所以我们看到得分很难拉开差距。只是在主频相差较大的时候,比如E3-1290(曙光I210r-G)与E3-1220(戴尔T110 II)的对比中会比较明显一些。

  本次横评我们要求厂商提供阵列卡,但或许是由于服务器定位在入门级,许多产品并没有提供独立的阵列卡,而是只用芯片组自带的RAID功能。唯一两款提供阵列卡的IBM X3250 M4和HP DL120 G7看起来就更加明显。 

服务器Netbench网络性能测试

  这个图中可以明显的看到,独立阵列卡对于磁盘性能的提升有多么明显。我们发现在IBM X3250 M4和HP DL120 G7中,成绩差距明显高于其他产品,而且使用RAID5阵列的HP DL120 G7成绩更为突出;相比之下,IBM的曲线则更平滑一些,受限于磁盘数量的原因,我们为其搭建的是RAID 0阵列。

  而在众多处于胶着状态的其他服务器测试数据中也可以看出一些端倪。虽然同样适用的是板载阵列功能,但由于芯片组型号的细微差异(C202、C204和C206芯片组)及磁盘本身的体制也带来了性能的不同。更重要的是,网卡数量在其中也起到了关键的作用。测试中表现不佳的宏碁AC100和戴尔T110 II均使用的是单网卡,而其他产品配备了双网卡。

  我们利用UNI-T UT71E智能数字万用表和相配套的软件对于对于被测服务器在几种不同的状态下的功耗进行了监测,主要包括如下项目:

  P1:连接电源但不开机状态

  P2:系统启动完毕,5分钟内无动作,但不休眠

  P3:系统启动完毕,处理器满载、磁盘以最大吞吐量工作

服务器功耗测试

  小兵张嘎里有一句话——别看现在闹得欢,小心将来拉清单。功耗测试就是拉清单的项目。之前凭借着处理器高主频和磁盘RAID领先的产品势必会造成功耗的提升,那么在功耗测试中它们的表现也就更为抢眼。我们看到,最低功耗的产品来自于宏碁AC100,因为超低电压的处理器和轻巧的设计结构。而同样采用E3-1260L处理器的富士通TX120 S3表现也不错。之前表现出众的HP DL120 G7功耗也是最高的,待机和峰值功耗都是同类产品中的老大。

  不过在我们最终评价的时候,性能提升与功耗提升并不会完全划等号,我们会以最终的能耗比作为参考点。换句话说,如果厂商用1W的性能获得了超过1点的性能提升,那么这个交换就是非常划算的。

  根据我们最终讨论形成的评估方案,我们认为以下几款产品在本次横评中的表现最为出色,特此给予2011-2012年度IT168服务器横评奖项。

横评总结及获奖产品推荐
IBM X3250 M4服务器横评总结及获奖产品推荐
惠普DL120 G7服务器
横评总结及获奖产品推荐
方正圆明LT200服务器
横评总结及获奖产品推荐
曙光I210R-G服务器
横评总结及获奖产品推荐
DELL T110 II服务器

  经过本次横评,我们总结了当前市场中最容易看到的11款至强E3服务器,这是目前为止业内最详细、最全面、最专业的关于至强E3平台产品的测试。从测试服务器数量、测试方式来看,IT168本次年度横评对于中小企业的选购来说无疑具备广泛的指导意义,特别是视频方式的引入可以让采购人员更好的了解到每款服务器的优点和缺点。

  展望2012年,英特尔即将推出面向双路平台应用的至强SandyBridge-EP处理器,开自英特尔服务器平台产品经理张振宇先生的消息——春节之后,确切的说是明年2月,我们就会看到这款期待已久的产品,这或许是龙年的第一个好消息。相信至强E5对于大中型企业来说也更具备选购价值,届时我们也将提供更新更全更好看的评测内容给大家。

  英特尔,明年看你的!

0
相关文章