服务器 频道

曙光Nehalem-EP服务器I620r-G深度评测

  ScienceMark v2.0 Membench

  ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。


ScienceMark v2.0 Membench L1测试成绩


ScienceMark v2.0 Membench L2测试成绩


ScienceMark v2.0 Membench 内存测试成绩

  首先我们进行的是ScienceMark的测试,主要考察系统的缓存和内存子系统情况。L1/L2 Cache的成绩主要是跟处理器频率相关,因为目前的处理器当中L1 Cache都是和处理器核心同频率的,而L2 Cache基本上也是——当前的处理器L2都是全速的(放置在处理器内但不在同一个芯片上的Pentium II为半速L2,而Pentium之前的处理器L2则和处理器分离,速度更低)。越快的频率,L1/L2性能就越好。而内存带宽主要由两部分相关:比较大的部分是内存架构,小部分是内存操作指令(集),例如使用最新的SSE指令集比通常的ALU指令集会得到更大的吞吐量,而不同的SSE版本性能也有不同。

ScienceMark Membench

厂商DawningDELL
产品型号I620r-G
Nehalem-EP
Intel Gainestown
Xeon E5540 2.53GHz
PowerEdge 2900 III
Intel Harpertown
Xeon E5430 2.66GHz
内存技术参数2GB R-ECC DDR3-1066 SDRAM x122GB FBD DDR2-667 SDRAM x4
L1带宽(MB/s)47705.8955376.16
L2带宽(MB/s)19499.2616757.55
内存带宽(MB/s)8620.404485.09
L1 Cache Latency(ns)
32 Bytes Stride2 cycles
0.79 ns
1.13 ns
L1 Algorithm Bandwidth(MB/s)
Compiler41485.2325201.968
REP MOVSD43346.8125467.15
ALU Reg Copy11990.3913093.65
MMX Reg Copy47705.8925242.19
SSE PAlign46105.3452826.21
SSE2 PAlign48167.8855376.16
L2 Cache Latency(ns)
4 Bytes Stride3 cycles
1.19 ns
1.13 ns
16 Bytes Stride3 cycles
1.19 ns
1.50 ns
64 Bytes Stride9 cycles
3.56 ns
4.51 ns
256 Bytes Stride8 cycles
3.17 ns
4.51 ns
512 Bytes Stride8 cycles
3.17 ns
4.89 ns
L2 Algorithm Bandwidth(MB/s)
Compiler18042.0611880.48
REP MOVSD19499.2612536.88
ALU Reg Copy8766.528577.86
MMX Reg Copy13988.4313408.31
SSE PAlign18664.2016719.97
SSE2 PAlign18664.2016757.55
Memory Latency(ns)
4 Bytes Stride3 cycles
1.19
1.13
16 Bytes Stride5 cycles
1.98
4.89
64 Bytes Stride23 cycles
9.10
19.17
256 Bytes Stride105 cycles
41.55
59.77
512 Bytes Stride118 cycles
46.70
68.04
Memory Algorithm Bandwidth(MB/s)
Compiler8013.283178.45
REP MOVSD8620.403220.23
ALU Reg Copy7066.532789.34
MMX Reg Copy8098.632972.91
MMX Reg 3dNow--
MMX Reg SSE7288.343978.53
SSE PAlign7121.204128.59
SSE PAlign SSE8001.724390.48
SSE2 PAlign7123.084326.42
SSE2 PAlign SSE7985.254441.71
MMX Block 4kb6499.164063.30
MMX Block 16kb6873.164479.88
SSE Block 4kb6582.424074.79
SSE Block 16kb4681.344485.09
 

  基本上,与处理器结合最紧密的L1,或L2(在有L3的情况下)的延迟总是跟处理器频率密集相关的,从总体测试结果来看,频率较低的Nehalem-EP的L1带宽要低一点,不过其运算带宽缺是Penryn Xeon的两倍左右。整体来说,Nehalem-EP的缓存/内存子系统比Penryn Xeon要强出不少。

0
第1页:Nehalem-EP处理器:曙光I620r-G服务器发布第2页:Nehalem:Tick-Tock战略的产物第3页:Nehalem设计思想的转变:基于企业应用第4页:深入Nehalem微架构:核心区间划分第5页:深入Nehalem微架构:指令拾取第6页:深入Nehalem微架构:解码与循环流检测第7页:深入Nehalem微架构:乱序执行引擎第8页:深入Nehalem微架构:乱序执行单元第9页:深入Nehalem微架构:乱序存取单元第10页:深入Nehalem微架构:乱序存取单元第11页:深入Nehalem微架构:缓存子系统第12页:深入Nehalem微架构:缓存子系统第13页:深入Nehalem微架构:核外系统/IMC和QPI第14页:深入Nehalem微架构:ccNUMA与HTT第15页:深入Nehalem微架构:ccNUMA、SMT与OS第16页:深入Nehalem微架构:虚拟化第17页:深入Nehalem微架构:SSE4.2指令集第18页:深入Nehalem微架构:制造工艺第19页:深入Nehalem微架构:长沟道晶体管技术第20页:深入Nehalem微架构:能耗比控制第21页:小结:Nehalem架构的优势第22页:Nehalem-EP:处理器规格对照表 第23页:Nehalem座驾:Tylersburg芯片组第24页:Nehalem座驾:Tylersburg规格第25页:实物图:Nehalem-EP Xeon第26页:实物图:Nehalem-EP Xeon第27页:实物图:Tylersburg-EP芯片组第28页:实物图:曙光Nehalem-EP服务器I620第29页:实物图:曙光Nehalem-EP服务器I620第30页:实物图:曙光Nehalem-EP服务器I620第31页:实物图:曙光Nehalem-EP服务器I620第32页:测试环境与测试方法第33页:曙光I620r-G服务器测试平台第34页:软件测试信息、系统部件简介第35页:SiSoftware Sandra 2009处理器性能测试第36页:SiSoftware Sandra 2009缓存性能测试第37页:SPEC CPU 2006整数性能测试第38页:SPEC CPU 2006浮点性能测试第39页:ScienceMark缓存内存子系统性能测试第40页:CineBench R10性能测试第41页:Iometer磁盘子系统性能测试第42页:NetBench文件服务器性能测试第43页:Benchmark Factory数据库性能测试 第44页:超线程能力对比测试:SiSoftware Sandra第45页:超线程能力对比测试:ScienceMark第46页:超线程能力对比测试:CineBench第47页:超线程能力对比测试:Iometer第48页:超线程能力对比测试:NetBench第49页:超线程能力对比测试:Benchmark Factory第50页:超线程能力对比测试:SPEC CPU 2006整数第51页:超线程能力对比测试:SPEC CPU 2006浮点第52页:平台功耗测试第53页:IT168评测中心观点
相关文章