【IT168评测中心】在美国智力问答节目《危险边缘》(Jeopardy!)中击败两名人类对手,以分数超出第二名两倍多的绝对优势大获全胜,使得超级电脑“沃森”(Watson)一时声名远扬,这是继10多年前电脑“深蓝”与卡斯帕罗夫的国际象棋大战之后,又一个电脑智能战胜人脑智能的实例。这两场轰动全球的事件无不与IBM这一蓝色巨人紧密联系在一起。
从进行大规模的计算,体现极强数学计算能力的“深蓝”,到“沃森”利用机器学习、大规模并行计算、语义处理,能够理解人类语言并作答问题,IBM以身体力行的实践推动并引领着人工智能技术的发展。“沃森”在几乎涵盖人类文明所有领域的问题面前能显得如此从容,是与它身后90台IBM小型机的高效数据处理分不开的。其实IBM也并非只是在大型机和小型机领域表现光鲜,对于通用的X86服务器,它也拥有极高的市场口碑。接下来我们将介绍的这款IBM System x3550 M3,就是IBM推出的一款基于英特尔架构的服务器。
IBM System X3550 M3采用了机架式设计,在为高密度布署设计高度只有1U的机箱中,配备了两个英特尔至强处理器,并且提供了多达18个内存插槽及最多8个3.5英寸硬盘,为企业的关键应用提供充足的内存和存储空间,可以用作Web 服务、电子商务、协作、分布式数据库、ERP 部署和虚拟化等应用的承载平台。
其实之前英特尔在发布至强5500系列处理器时,IBM就已相应推出了System x3550 M2,而在时隔一年之后,当可与Nehalem-EP共用平台的Westmere-EP发布时,IBM却并未直接沿用System x3550 M2作为IBM的Westmere-EP主力平台,而是推出了全新的IBM System x3550 M3,这多少有些出人意料。而从二者的简单对比不难发现,IBM System x3550 M3与它的前一代相比,在全面继承了System x3550 M2的10大技术创新设计之外,它在所支持的处理器,以及在内存、硬盘及RAID等方面都做了比较大的改变,下边我们就一起来由外到内,看看这款产品的详细设计。
对于整天和服务器打交道的运维人员来说,只要打量一眼便能轻易分辨出眼前这款产品来自IBM,尽管高度只有1U,除硬盘位以外面板空间几乎所剩无几,但还是能从它面板棱角、机架卡扣,甚至是散热孔等点滴之处,感觉出IBM产品外观平整、简练的设计特点。
▲IBM System x3550 M3整体图
▲IBM System x3550 M3产品标识
这款服务器在硬盘配置上明显与上一代IBM System x3550 M2不同, x3550 M2标配有6个2.5英寸硬盘位。而如今IBM System x3550 M3则改为了4个,不过它提供了最多8个硬盘的存储可选方案,这也使得这款产品的最大硬盘存储空间由3TB增加到了4TB。
▲IBM System X3550 M3整体图
IBM System X3550 M3并没有标配光驱,它在前面板设置了2个USB接口及VGA接口,可便于设备维护时外接显示器及鼠标键盘。IBM System X3550 M3设有一个很独特的弹出式功能面板,IBM称其为光通路诊断面板(Light Path Diagnostics Panel),当服务器发生硬件故障时,利用上边的指示灯,就可以判断出故障部件的位置,从而可以大幅缩短服务器的维修时间。
▲IBM System X3550 M3正面图
服务器的电源开关以及ID开关按键也都设置在光通路诊断面板上,电源开关处还设有一个小的滑块,当开启电源后,将滑动拨动到电源开关前面,电源开关就被锁止,这样也就可以避免无意触碰导致服务器的关机,设计的非常细致。
▲ IBM System X3550 M3面板控制区
这款服务器的光通路诊断面板(Light Path Diagnostics Panel)是与系统的BIOS紧密结合在一起的,并非只有进入到操作系统层面才能使用,而即使在系统加电阶段如果出现机器故障,光通路诊断也可以帮助用户指明故障位置。这也是IBM System x3550 M3采用了UEFI(Unified Extensibel Fireware Interface,统一扩展固件接口),使得其在原来BIOS的基础上在功能上有所扩展所至。
▲ 光通路诊断面板的开关
▲光通路诊断面板弹出后的效果
这款服务器后部设置了2个USB接口、1个串口以及1个VGA接口。并且提供有2个千兆网络接口及2个可选的千兆网络接口扩展位,这款产品还提供了一个百兆的IMM集成管理模块接口,利用它不仅可以对服务器进行远程系统监控,还可以进行服务器配置,为用户提供了服务器底层硬件的远程管理功能。
▲服务器接口部分
▲服务器接口部分
从图中可以看到,IBM System x3550 M3的风道设计非常清晰。2个处理器以及1个内存插槽区域形成了3个并列的独立风道,机箱横截面的另外近1/4部分则利用电源模块的散热系统进行散热。从整体机箱部局来看,它的两个Riser扩展卡与两个处理器共用散热风道,不过比较少见的是,它的独立磁盘阵列卡并没有安装于Riser扩展卡上,而是设置于两个电源模块的前端。
▲IBM System x3550 M3的内部图
IBM System x3550 M3可以搭配两个至强5600系列处理器,我们所测试的这款服务器安装有两个工作主频为2.53GHz的E5630处理器。在英特尔5600至强处理器系列中,该处理器属于主频较低的一款,该处理器为4核心设计,它的三级缓存同样也为12MB,相比高主频处理器,它在功耗以及性价比上表现更突出一些,与另一款比较常见的至强E5620一样,E5630也常常会被用作服务器的标配选择。如果用户有对服务器运算效率有更高要求的话,可以选装具有更高工作主频、6个核心的5600系列处理器。
▲IBM System x3550 M3采用的处理器
在这里需要提一下的是,这款服务器的处理器拆装采用了免工具设计,它的散热器安装与处理器的安装方式几乎完全相同,只要将压杆向外横拨,脱离卡口后轻轻抬起就可以将散热器取下,并不需要借助于任何工具,结构并不复杂,使用却非常方便。而目前市场中多数产品的CPU散热器还需螺丝固定,拆装费工费时,仅就这样一个小小的细节也能体现出成熟厂商在产品整体设计上的功力来。
▲IBM System x3550 M3采用的处理器
在内存的使用上,这款服务器共提供了18个RDIMM内存插槽,这也是双路服务器平台所能支持的最大数量,满插单条容量为8GB的内存,总容量最大可以支持到144GB。而在选用16GB的DDR3 RDIMM内存时,内存容量可以支持到192GB,可以为建模、模拟运算等高性能计算,以及数据库应用提供充足的内存支持。此次送测的这款服务器配备的是6条4GB的DDR3-1333内存,容量达到了24GB。
▲装配的6条DDR3-1333内存
▲单条容量为4GB
尽管这是一款1U的服务器,由于空间所限,使得其在扩展性方面受到了很大限制,不过它仍提供了2个PCI-E2.0 ×16插槽。可分别用于安装一个半高和一个全高的扩展板卡,来实现系统功能的扩展。
▲机箱右后端处的两个PCI-E2.0 ×16插槽
▲一个用于安装全高板卡,另一个安装半高板卡
单个模块最大可以有675的电能输出,一般情况下单电源模块就能满足服务器的电能要求,不过双电源冗余则可以更好的确保系统的平稳运行,而可插拔式设计也使模块在故障时更换起来更为方便。
▲插拔式冗余电源模块
▲ 两个电源模块
▲ 电源模块的标牌
这款服务器的网络主控芯片采用的是 Broadcom BCM5709C NetXtreme II GigE,为两个千兆端口。这款服务器还在后面板上预留了两个网络端口位,可以为有需求的用户提供相应的解决办法。
▲网络控制芯片
这款服务器主板集成有MAXIM +VSC452-05芯片,这是一个高度集成的主板管理芯片,图形显示只是它所能提供的众多功能之一。它内部集成了I/O以及BMC功能,包括基于硬件的加速引擎、USB功能、以太网MAC以及视频处理器和数字压缩引擎,从而可以帮助IBM System x3550 M3实现其IMM集成管理功能,利用KVM over IP方式实现对系统的诊断及远程的管理控制。
▲主板管理芯片
在前边也介绍过,这款服务器采用了外置式磁盘阵列卡,这块IBM ServeRAID M5015阵列卡被设计于两个电源模块的前端处,距离硬盘很近的地方,它可以支持RAID 0/1/5/6/60等多种阵列方式。这块阵列卡采用了LSI SAS2108 RoC,并设有512MB缓存,从主控芯片及缓存容量来看,应该与LSI MegaRAID SAS 9260-8i为同一级别的产品,对于其存储性能,在后边我们将结合测试数据为大家做详细介绍。
这块阵列卡的拆取安装也同样采用了免工具设计,利用图中下边的这个很小的转接卡直接插在主板上,并采用了一个拔片开关进行固定,安装及取下都很方便。
▲磁盘阵列卡
下图贴有如何拆取系统主板提示图的黑色塑料罩正是磁盘阵列卡的安装位置,塑料罩左下方的接口就是为安装磁盘阵列卡的转接卡而设计。
▲磁盘阵列卡的安装位置
该服务器配有4块2.5英寸SAS硬盘,硬盘转速为10000容量为146GB,在测试中我们采用的是目前最为常用,既兼顾数据安全,又具有较高数据读写性能的RAID 5阵列方式。
▲4块2.5英寸硬盘
从下图中大家除了能了解硬盘的指标情况外,也可以看到这款服务器所采用的金属材质的硬盘托架,在使用中,这种两侧及前边上端带有弹片的设计使得磁盘的取下及安装都很平稳顺畅,毫不费力。而这种硬盘托架对于IBM的刀片和机架服务器来说是通用的,也就是说对于IBM产品的用户来说,硬盘是可以直接互换使用的,这也更便于用户的系统维护。
▲刀片与机架通用的硬盘模块
这款服务器的散热主要是利用下边这6个风扇来实现的,不要以为这几个风扇平淡无奇,实际上这几个双段式风扇与我们通常看到的产品还真有些不同,两个扇叶扭转方向不同,且转动方向也相反的风扇组合在一起,在风扇截面不变的情况下,可以提供两倍于单一风扇的风力。同时反方向的扇叶转动还能有效抵消单向振动,减少服务器的共振。结合前边服务器内部结构图可以看到,每两个双段式风扇为一组为一个风道提供风力,也实现了冗余组合。
这款服务器的散热系统还有一个特殊之处,那就是它可以根据海拔高度的不同来调整风扇转速,以减少因海拔导致空气稀薄的不同对系统散热效果带来影响。该服务器配有海拔高度计,可以控制风扇的转速(海拔越高,转速越高,海拔越低,转速越低),以保证不同海拔下的散热能力,从而也使IBM System x3550 M3可以有更强的地域适应能力,尤其对于高海拔地区的使用来说该设计非常实用。
▲双段式散热风扇
对于服务器的测试,我们主要从产品满足用户应用的角度出发,分功能和性能两个方面来考察。其中性能测试主要体现的是服务器在提供特定服务时的具体的事务处理能力,而在功能上,主要反映的是服务器的可靠性、可扩展性以及易用性等方面的特征。另外,由于不论是最终用户还是处理器厂商,大家对于服务器的能耗问题都给以了很高的重视,为此,我们也继续将能耗作为考察服务器使用成本的重要指标。
▲网络测试环境
贴近应用的性能测试
在实际的应用中,不同的应用条件对于服务器子系统性能的要求也有一定的偏重,因此同一服务器在不同应用中所表现出的性能状况常会出现较大差异。为了能准确反映出服务器的性能状况,我们选择了Web、文件服务器和数据库等三种较为普遍的应用作为测试重点。之所以选用以上三种应用作为性能测试点,这几项应用相对较为普遍是原因之一,此外我们也考虑到这三种应用对于服务器子系统的要求也各有偏重,这样可以更全面的考察服务器各子系统的性能状况。
讲求实用的功能测试
可靠性、可扩展性和易用性同样也是用户关心的内容,但不同的用户对这三方面的需求会有所不同。比如一些中高端服务器产品,在应用中多采用专用机房或托管方式,这时其易用性中的可管理性方面就显得非常重要,远程管理会让工程师及时了解服务器工作状况,实现及时有效的管理和维护。而对于入门级服务器来说,由于很多用户会随着业务的增长会对其处理能力、存储容量有进一步的要求,这时其可扩展性就显得更为重要。可靠性是服务器的一个关键特性,它反映了服务器在应用过程中系统能否确保长时间正常工作,这也是服务器与普通PC之间的重要区别。对于以上三个方面,我们都制定了详细项目进行逐一考察。
兼顾使用成本的能效测试
服务器的售价反映的它是一次性的购买成本,而后期的使用成本是一个不容小视的问题,作为一个要求7×24连续工作的设备,它所产生的电费将是一笔不小的开销。实际上在评判服务器的运算能力时,一定不能将功耗问题视而不见,性能功耗比是衡量服务器运算效能的一个重要指标,测试中我们利用功率分析仪对服务器在加电关机、开机空载以及满负载三种状态下的功耗进行测定,为服务器的能效以及使用成本的估算提供数据支持。
为了进行网络产品的测试,IT168评测中心专门组建了网络实验室,并搭建了一个有60台客户端的网络测试环境,通过控制端并利用专业的网络测试软件,可以构建出多样化的网络访问模型,能够产生真实的多用户网络应用环境。可以对服务器类设备进行不同应用下的高压力性能测试,以直观的结果反映出服务器产品在用于不同应用时其真实的性能状况。
我们采用Cisco Catalyst 4506千兆交换机作为测试环境的交换设备,60台客户端采用的是DELL PowerEdge SC430以及DELL PowerEdge T100两种塔式的单路服务器,能产生足够大的网络访问压力,因而可以测试服务器类设备在实现不同应用时的极限性能。
▲网络实验室控制台
▲Cisco Catalyst 4506千兆交换机,120个千兆网口
▲用于产生用户访问压力的Dell PowerEdge SC430服务器
对于服务器性能方面的考察,我们主要分为子系统测试和应用性能测试。在子系统测试中我们按处理器、内存以及磁盘等各个子系统进行了分项测试,当然各子系统的测试成绩也是相辅相成,也需要其它子系统的支持,并非是完全独立的,只是对考察的子系统有所偏重而已。
- 处理器子系统测试
对服务器处理器子系统的考察,我们主要采用的是业界公认的SPEC CPU 2006测试,该项测试通过对数十个典型应用程序的运行,来测试系统处理器子系统在应用中的整、浮点运算效率。SPEC CPU 2006测试具有很好的开放性,因此在业界为广大用户所接受,可以利用这一公开的测试结果进行系统间运算性能的比较。
此外SiSoftware Sandra也有测试子项可用于处理器运算性能测试,其结果通常以每秒完成的指令数来表现。也可以用作不同处理器间运算效率的比较。
SPEC CPU 2006 v1.1
SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPEC CPU 2006是SPEC组织推出的CPU子系统评估软件最新版,我们之前使用的是SPEC CPU 2000。和上一个版本一样,SPEC CPU 2006包括了CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,后者则用于测量和对比浮点性能,SPEC CPU 2006中对SPEC CPU 2000中的一些测试进行了升级,并抛弃/加入了一些测试,因此两个版本测试得分并没有可比较性。
SPEC CPU测试中,测试系统的处理器、内存子系统和使用到的编译器(SPEC CPU提供的是源代码,并且允许测试用户进行一定的编译优化)都会影响最终的测试性能,而I/O(磁盘)、网络、操作系统和图形子系统对于SPEC CPU2006的影响非常的小。
SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。
我们在被测服务器中安装了Intel C++ 11.1.034 Compiler、Intel Fortran 11.1.034 Compiler这两款SPEC CPU 2006必需的编译器,通过最新出现的QxS编译参数,Intel Compiler 10版本开始支持对Intel SSE4指令集进行优化(假如只支持SSE3,则使用QxT编译参数)。我们另外安装了Microsoft Visual Studio 2003 SP1提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,使用了较多的编译选项。我们根据被测系统选择实际可同时处理的线程数量,最后得到SPEC rate base测试结果(基于base标准编译,SPEC base rate测试代表系统同时处理多个任务的能力)。
和其它测试部件不同,SPEC CPU 2006需要大量的系统物理内存,我们的SPEC测试在64位的Windows Server 2008 R2 下完成,对于每个运算核心,最低配置1.5GB内存。
- 内存子系统测试
对于内存子系统的考察,也是利用SiSoftware Sandra来实现,在该软件中有相应组件可进行内存带宽、内存延迟等方面的测试。
SiSoftware Sandra v2010
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。从2007开始,Sandra的Arithmetic benchmarks增加了对SSE3&SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一,SiSoftware Sandra 2010对NUMA架构以及最新的Windows 7/Windows Server 2008 R2提供了更好的支持,此外测试项目和测试结果也有了略微的变化。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。
- 存储子系统测试
对存储子系统的考察,是利用IOMeter这一软件来完成。
IOMeter 2006.07.27
IOMeter是一款功能非常强大的IO测试软件,它除了可以在本机运行测试本机的磁盘IO性能之外,还提供了模拟网络应用的能力。为了大家能更好的通过我们的测试数据进行不同系统之间的对比,我们在测试中都使用相同的脚本。其中的最大IO能力的测试中我们所采用的了数据块大小为512B,100%读取操作,随机率为0%。而另一测试数据块大小则选择了64KB,100%读取操作,随机率为0%,用于检测磁盘系统的最大吞吐量。
- 网络应用性能测试
应用性能测试则利用IT168的网络测试环境,模拟大量的客户端来实现对服务器进行访问,来测试服务器分别在提供Web、文件服务器和数据库服务时的性能表现。
WebBench性能测试
WebBench是针对服务器作为Web Server时的性能进行测试,我们在服务器上安装了IIS6.0组件,以提供测试所需的Web服务。在测试中我们使用了网络实验室中的60台客户端,分别使用了WebBench 5.0内置的动态CGI以及静态页面脚本对服务器进行了测试。
静态测试是由客户端读取预先放置在服务器Web Server下的Web页面(wbtree),这项测试主要考察的是服务器磁盘系统以及网络连接性能。
动态测试偏重于对服务器CPU子系统的性能测试,它对于Web服务器提供了足够的负载。当WebBench测试开始后,客户端会以每四台一组依次连接到服务器并发送CGI请求。当测试结束后,控制台会收集数据并绘制出服务器CGI响应数的变化曲线。CGI测试的成绩高低,主要取决于服务器处理器子系统性能的优劣。处理器子系统包括CPU、内存以及内存控制器,CPU频率、缓存以及内存容量大小和内存带宽,都会影响该项成绩。
NetBench 7.03性能测试
NetBench是针对文件服务器的性能测试软件,影响NetBench性能的主要是服务器的磁盘子系统,这里所使用的磁盘RAID卡对于测试结果将会有明显的影响。测试中我们在被测服务器上设立了文件服务器,NetBench通过网络实验室中60个客户端来模拟网络中的PC向文件服务器所发出的文件传输请求,文件服务器则将存储在磁盘上的文件数据发送给相应的客户端。同Webbench测试一样,NetBench测试开始后客户端会以每四台一组依连接到服务器并发送文件传输请求。测试结束后控制台收集数据并绘制出服务器能够达到的数据传输变化曲线。
Benchmark Factory for Databases 5.7.1g
数据库是服务器最为常见的一种应用,为了考察服务器在作为数据库的硬件平台时的性能表现,我们采用了Benchmark Factory for Databases 5.7.1g,利用Benchmark Factory内置的标准测试脚本AS3AP,可用于对于ANSI结构化查询语言(SQL)关系型数据库进行测试,不仅可用于测试DBMS(单用户微机数据库管理系统),也可用于测试高性能并行或者分布式数据库。
Benchmark Factory在测试之前会在数据库中生成多个表,其中包括4个500万行的表,每行包括100字节的数据,因此每个表容量大约是476MB,整个数据库容量为1.86GB。我们用实验室的60个客户端模拟1000个用户,在这个数据库中进行查询、添加、删除、修改等操作。可以给被测试的服务器施加相当大的测试压力。
服务器平台信息 | ||
产品名称 | IBM System X3550 M3服务器 | 基准服务器平台 |
平台类型 | 双路Intel Westmere-EP | 双路Intel Nehalem-EP |
处理器子系统 | ||
---|---|---|
处理器型号 | Intel Xeon E5630 | Intel Xeon X5570 |
处理器架构 | Intel 32nm Westmere | Intel 45nm Nehalem |
代号 | Westmere-EP | Gainestown |
处理器封装 | Socket 1366 LGA | Socket 1366 LGA |
核心/线程数量 | 4/8 | 4/8 |
主频 | 2.53GHz | 2.93GHz |
处理器指令集 | MMX,SSE,SSE2,SSE3, | MMX,SSE,SSE2,SSE3, SSE4.1,SSE4.2,EM64T,VT |
外部总线 | 2×QPI 2533MHz 5.86GT/s 单向11.73GB/s(QPI) 双向23.46GB/s(QPI) | 2x QPI 3.2GHz 6.4GT/s 单向12.8GB/s(QPI) 双向25.6GB/s(QPI) |
L1 Code Cache | 6× 32KB 8路集合关联 | 4× 32KB 8路集合关联 |
L1 Data Cache | 6× 32KB 4路集合关联 | 4× 32KB 4路集合关联 |
L2 Cache | 6× 256KB 8路集合关联 | 4× 256KB 8路集合关联 |
L3 Cache | 12MB 16路集合关联 | 8MB 16路集合关联 |
服务器主板 | ||
主板型号 | IBM 69Y4438 | Inspur NF5280 |
主板芯片组 | Intel 5520+ICH10R | Intel 5520+ICH10R |
北桥芯片特性 | 2×QPI VT-d Gen 2 | 2×QPI VT-d Gen 2 |
内存子系统 | ||
内存控制器 | 每CPU集成三通道R-ECC DDR3 1333 | 每CPU集成三通道R-ECC DDR3 1333 |
内存类型 | 4GB R-ECC DDR3 1333 SDRAM ×6条 | 2GB R-ECC DDR3 1333 SDRAM ×18条 |
存储子系统 | ||
磁盘控制器 | IBM ServeRAID M5015 | LSI MegaRAID SAS 8708ELP |
磁盘控制器规格 | LSI SAS2108 RoC 800MHz PowerPC 512MB RAM SAS 6Gbps Hardware RAID 0/1/5/6/60 | LSI1078 RoC 500MHz PowerPC 256MB RAM 8x SAS 3Gbps Hardware RAID 0/1/5/6 |
控制器驱动 | IBM ServeRAID M5015 6.1.7600.16385 | LSI MegaRAID R3.6 3.9.0.64 |
硬盘型号数量 | IBM MBD2147RC ×4个 | Hitachi Ultrastar 15K300 HUS153030VLS300 ×3个 |
硬盘规格 | 10000RPM 146GB 6Gb/s SAS 16MB Cache | 15000RPM 300GB SAS 3Gbps 16MB Cache |
网络连通性 | ||
网卡控制器 | Broadcom BCM5709C NetXtreme II GigE | Intel 82576EB Dual Port Gigabit Network Controller |
网卡驱动 | 5.2.14.0 | Intel PRO Set 13.5 |
软件环境 | ||
操作系统 | Microsoft Windows Server 2008 Enterprise Edition SP1 x64 | Microsoft Windows Server 2008 Enterprise Edition SP1 x64 |
该服务器所采用的两个英特尔至强E5630工作主频是2.53Hz,它在5600系列至强处理器中属于主频较低的,该处理器为4核心设计,可以支持8个线程。通常在更注重系统性价比的选配方案会采用该型号处理器。
▲处理器信息
由于5600系列处理器相对之前系列在核心数上有所增加,其三级缓存也相应有所提高,由主流至强5500系列的8MB提升到现在的12MB,虽然该服务器所采用的至强E5630也只是4核心设计,不过它的三级缓存是同高主频处理器一样,也同为12MB。
▲处理器缓存信息
主板信息显示该服务器主板为IBM自行设计,平台所采用了英特尔5520+ICH10R芯片组,也就是英特尔Tylersburg芯片组。
▲服务器主板信息
内存为三通道设置,该服务器采用的是6条共24GB的R-ECC DDR3 1333内存。
▲服务器内存信息
共设有18个内存插槽,最多可以为各类应用提供192GB的内存支持。
▲内存插槽信息
下图显示该服务器的显示核心为Matrox G200eV,不过它是前边介绍的集多项功能于一体的MAXIM +VSC452-05芯片的其中一个部分。
▲服务器显示核心信息
软件显示该服务器所用的处理器为4核心设计,整个服务器平台的两个处理器共有8个内核,可以实现16个线程同时工作。
▲处理器信息
这款送测的服务器所配内存容量为24GB,用户最高可以为其配备高达192GB内存,以适应服务整合、高性能运算等各类应用的需要。
▲服务器内存信息
主板采用了Intel Tylersburg 5520+ICH10R芯片组,主板提供了两个PCI-E扩展插槽。
▲主板芯片组信息
没有对比就无法衡量一款产品性能的高低,我们从上一代产品中选择了一款测试表现最好的服务器作为对比平台,从对比中我们可以了解到这款服务器的性能水平。
这两个相对比的服务器平台所配的处理器分属于英特尔至强5500和5600前后两个不同的系列,虽然二者每个处理器都是4个核心,但是二者的工作频率却有比较大的差距,IBM System x3550 M3采用的至强E5630工作主频为2.53GHz,在至强5600系列中属于主频相对较低的一款,而对比服务器平台所选用的至强X5570却是至强5500系列中工作主频最高的,为2.93GHz。接下来的对比也将是两个处理器配置悬殊的服务器平台间的较量。
SiSoftware Sandra Pro Business 2010 | ||
产品名称 | IBM System X3550 M3服务器 | 基准服务器平台 |
平台类型 | 双路Intel Westmere-EP | 双路Intel Nehalem-EP |
处理器型号 | Xeon 5630 | Xeon 5570 |
Processor Arithmetic Benchmark 处理器算术运算测试 | ||
---|---|---|
Dhrystone ALU | 125.67GIPS | 139.6GIPS |
Dhrystone ALU vs SPEED | 49.61MIPS/MHz | 48.75MIPS/MHz |
Whetstone iSSE3 | 103.57 GFLOPS | 121.13GFLOPS |
Dhrystone iSSE3 vs SPEED | 40.89MFLOPS/MHz | 42.29MFLOPS/MHz |
Processor Multi-Media Benchmark 处理器多媒体测试 | ||
Multi-Media Int x16 iSSE4.1 | 237MPixel/s | 296.85MPixel/s |
Multi-Media Int x16 iSSE4.1 vs SPEED | 107.03kPixels/s/MHz | 101.21kPixel/s/MHz |
Multi-Media Float x8 iSSE2 | 202.71MPixel/s | 228.24MPixel/s |
Multi-Media Float x8 iSSE2 vs SPEED | 80.03kPixels/s/MHz | 77.82kPixels/s/MHz |
Multi-Media Double x4 iSSE2 | 110MPixel/s | 125.88MPixel/s |
Multi-Media Double x4 iSSE2 vs SPEED | 43.41kPixels/s/MHz | 42.92kPixels/s/MHz |
Multi-Core Efficiency Benchmark 处理器效能测试 | ||
Inter-Core Bandwidth | 63GB/s | 75.61GB/s |
Inter-Core Bandwidth vs SPEED | 25.43MB/s/MHz | 26.40MB/s/MHz |
Inter-Core Latency(越小越好) | 21ns | 16ns |
Inter-Core Latency vs SPEED(越小越好) | 0.01ns/MHz | 0.01ns/MHz |
.NET Arithmetic Benchmark .NET算术运算测试 | ||
Dhrystone .NET | 27.64GIPS | 32.13GIPS |
Dhrystone .NET vs SPEED | 10.91MIPS/MHz | 11.22MIPS/MHz |
Whetstone .NET | 68.68GFLOPS | 76.45GFLOPS |
Whetstone .NET vs SPEED | 27.11MFLOPS/MHz | 26.69MFLOPS/MHz |
.NET Multi-Media Benchmark .NET多媒体测试 | ||
Multi-Media Int x1 .NET | 50.67MPixel/s | 62.28MPixel/s |
Multi-Media Int x1 .NET vs SPEED | 20kPixel/s | 21.23kPixels/s/MHz |
Multi-Media Float x1 .NET | 21.53kPixels/s/MHz | 26.19MPixel/s |
Multi-Media Float x1 .NET vs SPEED | 8.5kPixels/s/MHz | 8.93kPixels/s/MHz |
Multi-Media Double x1 .NET | 39.48MPixel/s | 51.45MPixel/s |
Multi-Media Double x1 .NET vs SPEED | 15.59kPixels/s/MHz | 17.54kPixels/s/MHz |
从以上测试结果来看,虽然对比平台所用处理器主频要高一些,不过在运算性能方面却并未取得太大优势,二者在Dhrystone ALU测试结果差别不大,这也反映出英特尔的5500和5600两代至强处理器间并非只是在制程工艺上有了改变,至强5600系列处理器在单位时间内的整点运算效率上也有了不小的提升。不过在Whetstone iSSE3运算方面,高主频的处理器表现会更好一些。
SiSoftware Sandra Pro Business 2010 | ||
产品名称 | IBM System X3550 M3服务器 | 基准服务器平台 |
平台类型 | 双路Intel Westmere-EP | 双路Intel Nehalem-EP |
处理器型号 | Xeon 5630 | Xeon 5570 |
Memory Bandwidth Benchmark 内存带宽测试 | ||
---|---|---|
Int Buff'd iSSE2 Memory Bandwidth | 31.88GB/s | 16.93GB/s |
Float Buff'd iSSE2 Memory Bandwidth | 31.8GB/s | 16.90GB/s |
Memory Latency Benchmark 内存延迟测试 | ||
Memory(Random Access) Latency (越小越好) | 90ns | 81ns |
Memory(Random Access) Latency vs SPEED (越小越好) | 0.16ns/MHz | |
Speed Factor (越小越好) | 57.1 | 61.40 |
Internal Data Cache | 4clocks | 4clocks |
L2 On-board Cache | 10clocks | 10clocks |
L3 On-board Cache | 53clocks | 48clocks |
Cache and Memory Benchmark 缓存及内存测试 | ||
Cache/Memory Bandwidth | 112.74 GB/s | 143.24GB/s |
Cache/Memory Bandwidth vs SPEED | 45.58MB/s/MHz | 50.01MB/s/MHz |
Speed Factor (越小越好) | 20.7 | 20.90 |
Integrated Data Cache | 348.7GB/s | 448.46GB/s |
L2 On-board Cache | 243.53GB/s | 421.42GB/s |
两台服务器的处理器的微架构实际都源自Nehalem,在处理器的整体设计上变化不是太大,它们都采用了集成内存控制器的设计,因此内存带宽方面与服务器平台所采用的处理器,以及内存条种类和数量相关,从理论上来讲两款对比的服务器在选用主频相近的两代处理器时,测试表现将不会有太大差异。
CineBench R10 | ||
产品名称 | IBM System X3550 M3服务器 | 基准服务器平台 |
平台类型 | 双路Intel Westmere-EP | 双路Intel Nehalem-EP |
处理器型号 | Xeon 5630 | Xeon 5570 |
CPU Benchmark | ||
---|---|---|
Rendering (1 CPU) | 3661 CB-CPU | 4410 CB-CPU |
Rendering (x CPU) | 23383 CB-CPU | 28172 CB-CPU |
Multiprocessor Speedup | 6.39x | 6.39x |
OpenGL Benchmark | ||
OpenGL Standard | 168 CB-GFX | 224 CB-GFX |
CineBench10所进行的图片渲染主要考察的是系统的浮点运算方面的性能,测试结果无疑还是工作主频占有优势的基准平台占有优势,不过这种差异也并不是特别悬殊。
▲Cinebench R11.5测试截图
利用Cinebench R11.5进行的测试中,在8个处理器核心16个线程同时运行的情况下,它对CG图片的渲染速度为8.32pts,这一成绩也符合当前服务器的配置状况。
虽然两个对比平台所选用的处理器工作主频有较大差距,但SPECint_rate_base2006的综合测试成绩还是多少让人吃了一惊,处理器工作主频较低的IBM System x3550 M3的成绩比基准对比平台要高出不少,用多项以整点运算为主的应用来比较,显然IBM System x3550 M3的处理能力要远强于我们所选出的基准对比平台。
相对于前边SisoftWare的Whetstone iSSE3测试来说,显然SPEC CPU 2006利用多种基准应用程序的运算成绩进行性能评估会更能准确反映系统的实际表现。测试中SPECfp_rate_base2006的成绩表明,在进行多种基准应用程序的运算时,选用至强E5630的IBM System x3550 M3浮点运算综合表现却比对比平台还稍好一些。
通过SPEC CPU测试可以看出,只配备了至强E5630处理器的IBM System x3550 M3在实际的整、浮点运算性能上已经超过了对比平台,而IBM System x3550 M3在处理器上还有很大选择空间。这也意味着这款服务器在各类应用中将能提供更为出色的处理性能。
以下截图反映的是IBM System x3550 M3与对比平台的磁盘读写性能,IBM System x3550 M3采用的阵列卡是IBM ServeRAID M5015,并配有4块转速为10000的2.5英寸SAS硬盘,而对比平台则是采用了比较流行的LSI MegaRAID SAS 8708ELP阵列卡配三块Hitachi 15K300硬盘的配置。
测试结果不言自明,在都采用RAID5的情况下,显然IBM System x3550 M3的磁盘读写性能相比基准平台优势非常明显。
▲磁盘IO读取性能
▲磁盘IO写入性能
▲磁盘读取吞吐性能
▲磁盘写入吞吐性能
Netbench测试主要反映被测服务器在用作文件服务器时所能提供的网络数据传输能力。下图中两条曲线分别代表在不同数量的用户访问服务器时,由1个增加到60个的过程中,文件服务器所提供的数据吞吐量。从测试结果可以看到,IBM System x3550 M3在用于文件服务器时,其性能相比基准服务器平台有非常大的优势,综合性能基本上是对比平台的2.5倍,这不仅体现在这款服务器磁盘子系统性上的优异表现,同时也体现了整个服务器平台在数据处理能力的超强能力。
▲Netbench测试成绩对比
▲数据库性能成绩
数据库应用是服务器平台最常使用的应用之一,该应用不仅对处理器处理能力和内存读写性能有较高要求,同时对服务器平台磁盘存储系统以及网络响应能力也是一种考验。以较为常见的SQL2005数据库应用来说,IBM System x3550 M3在访问用户数达到500左右时,每秒可处理的查询、添加、删除、修改等数据库操作可以达到15万左右,而基准服务器平台的成绩却不到12万,二者在数据库应用中的性能差异的确不小。
从这项测试中我们也不难看出,对于运算及网络综合性能,这款IBM System x3550 M3相比对比平台都占有优势。而对比平台是上一年中我们所测试的综合性能表现最优的一款双路服务器,而当前这款IBM System x3550 M3在处理器上采用的仅是至强E5630,在硬件配置及性能方面还有很大提升空间。
▲功耗测试结果对比
与前边的性能对比,悬殊的功耗测试结果可能会给你带来更多的震撼。在服务器进入到操作系统并不进行其它事务处理时, IBM System x3550 M3的功耗为151瓦,而对比平台就需要280瓦,相差将近有一倍之多。而在进行高负载运算时,IBM System x3550 M3的功耗在250瓦左右,而对比平台则高达445瓦。而这样的功耗差异是在IBM System x3550 M3能提供更高处理能力的前提下取得的,这也反映出两个平台在性能功耗比上的差距也将会被进一步放大。
很多人看过IBM广告会笑谈IBM是以哲学研究见长,不过大家也都心知肚明,多少年来IBM对于品牌的经营并非是依靠这些有时让人难以领会的广告宣传,而是源自其深厚的产品技术底蕴以及对企业IT运行及业务运作能进行全方位支持的服务能力。不论是基本由IBM主导的大型机领域,还是市场占有近半的小型机,无不是以产品技术优势而取胜。而在IBM System x3550 M3这样一款x86服务器上,同样能让人看到产品整体设计上的细致和独到。
在硬件配置相同的情况下,不同的产品在性能上表现并不会有太大差距,而作为一个企业业务的承载平台,用户更看重的是产品的稳定性、可用性以及管理维护便捷性等方面。而产品要具备这些特征并不是通过几个部件的简单拼凑就能实现,而是需要细致的整体设计和长时间的实践检验和不断改进。IBM System x3550 M3的高可用性设计及易维护的特性也正是源自厂商的产品整体设计能力。
除硬件设计外,IBM为其提供的ToolsCenter管理工具集,涉及了产品部署、更新以及配置和诊断,并且可以定制可启动光盘,可以对系统管理起到很好的帮助。此外利用IBM Systems Director系统管理平台可以对IBM的System P、System z以及IBM存储设备进行管理,同时还可管理非IBM的x86服务器。是用户实现设备管理非常得力的工具。
其实与市场中同类产品相比,IBM System x3550 M3的竞争优势除了产品本身之外,还有就是来自IBM自上到下完整的产品体系的建立上,由于从大型机、小型机,到X86服务器和存储系统,再加上软件、业务咨询和IT服务,IBM可以为企业用户提供各类完整的IT解决方案,这也让这款IBM System x3550 M3有更多机会出现在一些企业的IT整体解决方案中,成为Web 服务、分布式数据库、虚拟化应用的硬件平台。