【IT168 评测】四路服务器一直都被大中型企业所普遍采用,而在至强E5系列出现之前,这部分一直被英特尔高端的处理器所把持着,比如我们熟悉的至强E7系列。不过在最新的至强E5家族中,已经出现了面向四路应用的E5-4600系列产品,它的特性是在秉承了部分四路应用特性的同时,价格和功耗也有了明显的下降,更适合注重性价比的公司采用。近日,我们收到了来自浪潮集团送测的一款样机,型号为NF8420 M3。
浪潮四路服务器NF8420 M3
浪潮NF8420 M3服务器
从型号就可以看出,浪潮NF8420服务器这次已经升级到了第三代的版本,采用了全新的至强E5-4600系列处理器。刚刚我们介绍过,E5-4600专为四路应用而设计,相比我们常见的E5-2600来说,E5-4600提供了优化的密度、优化的成本和优化的HPC性能,相比E7来说在价格上也更具优势。
这次送测的浪潮NF8420 M3经过了全新的设计,4个散热模块被设置在了服务器的前方,同时每个模块配有2个风扇,也就是说同时有8个风扇提供散热,也提供了单位级别的冗余。而且在细节方面,我们发现也增加了一些小提示——四路服务器是非常重的,满配的时候的确需要2人合力才能抬起来。
在机身背面,我们看到了4个冗余的电源,同时还有6个PCI-E插槽位。从外观上能看到的信息就是这么多了,具体的还是要看看系统内部的构造。
刚刚我们提到,浪潮NF8420 M3的设计上有一些小亮点,比如下图中大家可以看到它的阵列卡位于机身前方,而且为了方便走线在侧面设置了线卡。这些小的设计说明即便是作为国产服务器,浪潮也在不断的追求完善,这也从侧面说明服务器的竞争已经不仅仅是硬件规格和配置的竞争,更是细节和应用的全面体验。
除了侧面的线卡之外,在散热方面浪潮也做了一些小变化,比如内存和处理器插槽附近的CMOS电容上也安装了散热片,如果你仔细观察的话会发现前方的散热片要小一些,后面的更大一些,这也是迎合了服务器散热走风的需要。
本次我们收到的浪潮NF8420 M3四路服务器基于至强E5-4620处理器,这是E5-4600系列7款产品的中端产品,具体的规格见下表:
这是一款基于英特尔SandyBridge架构的产品,采用了32nm制程工艺,主频为2.2GHz,睿频之后可以达到2.6GHz;三级缓存为16MB,QPI总线达到了7.2GT/s,8核心16线程,TDP功耗为95W。就性能来说,因为核心数量和QPI总线的优势,在BenchMark下应该有着不错的表现。
单条容量为8GB的三星DDR3内存
Adaptec-6805阵列卡,最大通过扩展器可以支持256个SATA/SAS硬盘
AST2300芯片,整合了iKVM和视频功能,也是国产服务器中常见的芯片
英特尔82576千兆网络芯片
浪潮与长城合作研发的730W电源,支持80Plus标准
从本次送测的浪潮NF8420 M3四路服务器配置来看,这是一款处于中高端的产品,强劲的处理器加上巨大的内存容量,让我们对其性能也充满了期待。下面我们将进入测试环节,通过基准软件观察它的表现。
对于性能方面的考察,我们主要分为子系统测试和应用性能测试。在子系统测试中我们按处理器、以及磁盘等各个子系统进行了分项测试,当然各子系统的测试成绩也是相辅相成,也需要其它子系统的支持,并非是完全独立的,只是对考察的子系统有所偏重而已。
处理器子系统测试
对服务器处理器子系统的考察,我们主要采用的是业界公认的SPEC 2006测试,该项测试通过对数十个典型应用程序的运行,来测试系统处理器子系统在应用中的整、浮点运算效率。SPEC 2006测试具有很好的开放性,因此在业界为广大用户所接受,可以利用这一公开的测试结果进行系统间运算性能的比较。CPUCPU
此外SiSoftware Sandra也有测试子项可用于处理器运算性能测试,其结果通常以每秒完成的指令数来表现。也可以用作不同处理器间运算效率的比较。
SPEC CPU 2006 v1.1
SPEC是标准性能评估公司(Standard Performance Evaluation Corporation)的简称。SPEC是由计算机厂商、系统集成商、大学、研究机构、咨询等多家公司组成的非营利性组织,这个组织的目标是建立、维护一套用于评估计算机系统的标准。
SPEC CPU 2006是SPEC组织推出的CPU子系统评估软件最新版,我们之前使用的是SPEC CPU 2000。和上一个版本一样,SPEC CPU 2006包括了CINT2006和CFP2006两个子项目,前者用于测量和对比整数性能,后者则用于测量和对比浮点性能,SPEC CPU 2006中对SPEC CPU 2000中的一些测试进行了升级,并抛弃/加入了一些测试,因此两个版本测试得分并没有可比较性。
SPEC CPU测试中,测试系统的处理器、子系统和使用到的编译器(SPEC CPU提供的是源代码,并且允许测试用户进行一定的编译优化)都会影响最终的测试性能,而I/O(磁盘)、网络、和图形子系统对于SPEC CPU2006的影响非常的小。操作系统内存
SPECfp测试过程中同时执行多个实例(instance),测量系统执行计算密集型浮点操作的能力,比如CAD/CAM、科学计算等方面应用可以参考这个结果。SPECint测试过程中同时执行多个实例(instances),然后测试系统同时执行多个计算密集型整数操作的能力,可以很好的反映诸如数据库服务器、电子邮件服务器和Web服务器等基于整数应用的多处理器系统的性能。
我们在被测服务器中安装了Intel C++ 11.1.034 Compiler、Intel Fortran 11.1.034 Compiler这两款SPEC CPU 2006必需的编译器,通过最新出现的QxS编译参数,Intel Compiler 10版本开始支持对Intel SSE4指令集进行优化(假如只支持SSE3,则使用QxT编译参数)。我们另外安装了Microsoft Visual Studio 2005 SP1提供必要的库文件。按照SPEC的要求我们根据自己的情况编辑了新的Config文件,使用了较多的编译选项。我们根据被测系统选择实际可同时处理的线程数量,最后得到SPEC rate base测试结果(基于base标准编译,SPEC base rate测试代表系统同时处理多个任务的能力)。
和其它测试部件不同,SPEC CPU 2006需要大量的系统物理内存,我们的SPEC测试在64位的Windows Server 2008 R2 下完成,对于每个运算核心,最低配置1.5GB内存。
SiSoftware Sandra v2012
SiSoftware Sandra是一款可运行在32bit和64bit Windows上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。从2007开始,Sandra的Arithmetic benchmarks增加了对SSE3&SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一,SiSoftware Sandra 2012对NUMA架构以及最新的Windows 7/Windows Server 2008 R2提供了更好的支持,此外测试项目和测试结果也有了略微的变化。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。
四路处理器一般大家接触得都比较少,下面我们也将放出部分测试截图,可以看到E5-4620的详细规格:
被测服务器总内存容量达到256GB,非常恐怖
32条内存插槽,这个数量并非是标准的,标准数量为48条
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。
值得一提的是,原来的CineBench R10已经不能再适应如今的测试需要,因为R10只能支持24个处理器核心。如今的核心数量为32个(算上超线程),所以只有R11.5能够支持最多48个核心。
从测试结果来看,单核心的成绩为1.05 pts,这个成绩并不算高,这是受限于主频的影响。但是多核心的成绩达到了17.21 pts,对比我们之前测试的E5系列产品来说有了25%以上的提升,这得益于核心数量的优势。MP Ratio的成绩为16.46x,这与超线程的结果一致。
AIDA64内存性能测试本是我们针对至强处理器进行的项目,虽然酷睿处理器同样适用,但因为自身的性能太低,内存与缓存的协调也未经优化,此成绩仅供参考。
我们看到,内存读取的性能达到了12700MB/s,写入速度为5300MB/s以上;而在涉及到缓存的项目中,成绩更是突出,但总体来说读取速度达到了写入速度的2倍左右。
SiSoftware Sandra软件我们常用的处理器计算性能测试软件,我们采用的这款软件版本是2012,此版本可以更好的支持至强E5处理器。虽然是Lite版本,但是对于我们的测试来说并无大碍。
SiSoftware Sandra 2012测试 | |
产品型号 | 浪潮NF8420 M3 |
算数处理器 | |
---|---|
总计本地功效 | 567.42 |
Dhrystone整数 SSE4.2 | 721 |
Whetstone双精度浮点数 SSE3 | 446.52 |
总计本地功效(单线程) | 8.87 |
Dhrystone整数 SSE4.2(单线程) | 11.27 |
Whetstone双精度浮点数 SSE3(单线程) | 7 |
多媒体处理器 | |
总计多媒体功效 | 896.74 |
多媒体整数 x16 SSE4.1 | 1 |
多媒体浮点数 x8 SSE2 | 789.38 |
总计多媒体功效(单线程) | 14 |
多媒体整数 x16 SSE4.1(单线程) | 15.92 |
多媒体浮点数 x8 SSE2(单线程) | 12.33 |
加密解密性能 | |
密码学带宽 | 6.43 |
加密带宽/解密带宽 AES256-ECB AES | 18.57 |
散列带宽 SHA2-256 SSE4 | 2.23 |
.NET算数 | |
总计.NET功效 | 88.81 |
Dhrystone整数.NET | 38.6 |
Whetstone双精度浮点数.NET | 204.3 |
.NET多媒体 | |
总计多媒体.NET功效 | 117 |
.NET多媒体整数 | 126.9 |
.NET多媒体浮点数 | 63.5 |
多媒体双精度浮点数 .NET | 107.81 |
多媒体浮点数/双精度.NET | 82.74 |
四路服务器的优势就在于能够让多颗处理器协同工作,提供更高的计算效率,更大的带宽和更快的处理能力。从测试结果来说,相比我们之前测试的同频E5-2600系列产品来说提升在80%以上,这已经是一个不容易的成绩了。
|
|