服务器 频道

Intel Nehalem-EP处理器首发深度评测

Click Here

  ScienceMark v2.0 Membench

  ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。


ScienceMark v2.0 Membench L1测试成绩


ScienceMark v2.0 Membench L2测试成绩


ScienceMark v2.0 Membench 内存测试成绩

  首先我们进行的是ScienceMark的测试,主要考察系统的缓存和内存子系统情况。L1/L2 Cache的成绩主要是跟处理器频率相关,因为目前的处理器当中L1 Cache都是和处理器核心同频率的,而L2 Cache基本上也是——当前的处理器L2都是全速的(放置在处理器内但不在同一个芯片上的Pentium II为半速L2,而Pentium之前的处理器L2则和处理器分离,速度更低)。越快的频率,L1/L2性能就越好。而内存带宽主要由两部分相关:比较大的部分是内存架构,小部分是内存操作指令(集),例如使用最新的SSE指令集比通常的ALU指令集会得到更大的吞吐量,而不同的SSE版本性能也有不同。

ScienceMark Membench
厂商 Intel Intel Intel
产品型号 Nehalem-EP
Intel Gainestown
Xeon X5570 2.93GHz
A650
AMD Shanghai
Operton 2378 2.40GHz
PowerEdge 2900 III
Intel Harpertown
Xeon E5430 2.66GHz
内存技术参数 4GB R-ECC DDR3-1333 SDRAM x6 4GB R-ECC DDR3-1333 SDRAM x6 4GB R-ECC DDR3-1333 SDRAM x6
L1带宽(MB/s) 47880.48 48167.88 55376.16
L2带宽(MB/s) 19604.64 14314.34 16757.55
内存带宽(MB/s) 10116.61 6672.76 4485.09
L1 Cache Latency(ns)
32 Bytes Stride 2 cycles
0.68 ns
1.25 ns 1.13 ns
L1 Algorithm Bandwidth(MB/s)
Compiler 43072.25 34042.63 25201.96
REP MOVSD 43467.25 34864.10 25467.15
ALU Reg Copy 11949.09 12166.94 13093.65
MMX Reg Copy 22537.36 25698.47 25242.19
SSE PAlign 47773.13 48167.40 52826.21
SSE2 PAlign 47880.48 48167.88 55376.16
L2 Cache Latency(ns)
4 Bytes Stride 3 cycles
1.02 ns
1.25 ns 1.13 ns
16 Bytes Stride 3 cycles
1.02 ns
1.25 ns 1.50 ns
64 Bytes Stride 8 cycles
2.73 ns
3.75 ns 4.51 ns
256 Bytes Stride 8 cycles
2.73 ns
6.25 ns 4.51 ns
512 Bytes Stride 7 cycles
2.39 ns
6.25 ns 4.89 ns
L2 Algorithm Bandwidth(MB/s)
Compiler 18039.64 11609.57 11880.48
REP MOVSD 19604.64 12140.00 12536.88
ALU Reg Copy 8788.90 9273.71 8577.86
MMX Reg Copy 14083.83 12042.45 13408.31
SSE PAlign 18731.92 14314.34 16719.97
SSE2 PAlign 5833.93 14289.88 16757.55
Memory Latency(ns)
4 Bytes Stride 3 cycles
1.02 ns
1.67 ns 1.13 ns
16 Bytes Stride 5 cycles
1.70 ns
5.00 ns 4.89 ns
64 Bytes Stride 22 cycles
7.50 ns
20.00 ns 19.17 ns
256 Bytes Stride 102 cycles
34.77 ns
34.58 ns 59.77 ns
512 Bytes Stride 117 cycles
39.88 ns
81.24 ns 68.04 ns
Memory Algorithm Bandwidth(MB/s)
Compiler 9210.17 2872.77 3178.45
REP MOVSD 10116.61 2887.02 3220.23
ALU Reg Copy 8156.00 2654.29 2789.34
MMX Reg Copy 9306.18 2943.85 2972.91
MMX Reg 3dNow - 6631.75 -
MMX Reg SSE 8781.26 6672.76 3978.53
SSE PAlign 8580.24 5765.46 4128.59
SSE PAlign SSE 9524.07 6611.10 4390.48
SSE2 PAlign 8560.83 5766.87 4326.42
SSE2 PAlign SSE 9555.13 6612.42 4441.71
MMX Block 4kb 7743.82 4450.46 4063.30
MMX Block 16kb 8321.35 4677.49 4479.88
SSE Block 4kb 7890.10 4441.71 4074.79
SSE Block 16kb 8355.86 4681.34 4485.09

  基本上,与处理器结合最紧密的L1,或L2(在有L3的情况下)的延迟总是跟处理器频率密集相关的,从总体测试结果来看,Nehalem-EP Xeon X5570全面强于基准平台,不过有两项数值很奇怪:SSE2 PAlign的L1测试和L2测试,这个数值明显不正常。

1
第1页:Intel Nehalem-EP处理器首发深度评测第2页:Nehalem:Tick-Tock战略的产物第3页:Nehalem设计思想的转变:基于企业应用第4页:深入Nehalem微架构:核心区间划分第5页:深入Nehalem微架构:指令拾取第6页:深入Nehalem微架构:解码与循环流检测第7页:深入Nehalem微架构:乱序执行引擎第8页:深入Nehalem微架构:乱序执行单元第9页:深入Nehalem微架构:乱序存取单元第10页:深入Nehalem微架构:乱序存取单元第11页:深入Nehalem微架构:缓存子系统第12页:深入Nehalem微架构:缓存子系统第13页:深入Nehalem微架构:核外系统/IMC第14页:深入Nehalem微架构:核外系统/QPI第15页:深入Nehalem微架构:ccNUMA架构第16页:深入Nehalem微架构:超线程技术第17页:深入Nehalem微架构:ccNUMA、SMT与OS第18页:深入Nehalem微架构:虚拟化第19页:深入Nehalem微架构:SSE4.2指令集第20页:深入Nehalem微架构:制造工艺第21页:深入Nehalem微架构:长沟道晶体管技术第22页:深入Nehalem微架构:能耗比控制第23页:深入Nehalem微架构:能耗比控制第24页:小结:Nehalem架构的优势第25页:Nehalem-EP:处理器规格对照表 第26页:Nehalem座驾:Tylersburg芯片组结构第27页:Nehalem座驾:Tylersburg芯片组PCIExpress第28页:Nehalem座驾:Tylersburg芯片组QPI第29页:Nehalem座驾:Tylersburg芯片组其它特性第30页:Nehalem座驾:四种Tylersburg规格对照表第31页:实物图:Nehalem-EP最高型号Xeon X5570第32页:实物图:Tylersburg-EP芯片组第33页:实物图:Intel Nehalem-EP测试样机第34页:实物图:Intel Nehalem-EP测试样机第35页:实物图:Intel Nehalem-EP测试样机第36页:实物图:Intel Nehalem-EP测试样机第37页:测试环境与测试方法第38页:Nehalem-EP服务器对比测试平台第39页:软件测试信息、系统部件简介第40页:SiSoftware Sandra 2009处理器性能测试第41页:SiSoftware Sandra 2009缓存内存性能测试第42页:SPEC CPU 2006整数性能测试第43页:SPEC CPU 2006浮点性能测试第44页:ScienceMark缓存内存子系统性能测试第45页:CineBench R10性能测试第46页:Iometer磁盘子系统性能测试第47页:NetBench文件服务器性能测试第48页:Benchmark Factory数据库性能测试第49页:超线程能力对比测试:SiSoftware Sandra第50页:超线程能力对比测试:ScienceMark第51页:超线程能力对比测试:CineBench第52页:超线程能力对比测试:Iometer第53页:超线程能力对比测试:NetBench第54页:超线程能力对比测试:Benchmark Factory第55页:超线程能力对比测试:SPEC CPU 2006整数第56页:超线程能力对比测试:SPEC CPU 2006浮点第57页:Nehalem-EP平台功耗测试第58页:IT168评测中心观点
相关文章