Intel Nehalem-EP处理器首发深度评测
ScienceMark v2.0 Membench
ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件,MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块,它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟,另外还可以测试不同指令集的性能差异。

ScienceMark v2.0 Membench L1测试成绩

ScienceMark v2.0 Membench L2测试成绩

ScienceMark v2.0 Membench 内存测试成绩
首先我们进行的是ScienceMark的测试,主要考察系统的缓存和内存子系统情况。L1/L2 Cache的成绩主要是跟处理器频率相关,因为目前的处理器当中L1 Cache都是和处理器核心同频率的,而L2 Cache基本上也是——当前的处理器L2都是全速的(放置在处理器内但不在同一个芯片上的Pentium II为半速L2,而Pentium之前的处理器L2则和处理器分离,速度更低)。越快的频率,L1/L2性能就越好。而内存带宽主要由两部分相关:比较大的部分是内存架构,小部分是内存操作指令(集),例如使用最新的SSE指令集比通常的ALU指令集会得到更大的吞吐量,而不同的SSE版本性能也有不同。
| ScienceMark Membench | |||
|---|---|---|---|
| 厂商 | Intel | Intel | Intel |
| 产品型号 | Nehalem-EP Intel Gainestown Xeon X5570 2.93GHz |
A650 AMD Shanghai Operton 2378 2.40GHz |
PowerEdge 2900 III Intel Harpertown Xeon E5430 2.66GHz |
| 内存技术参数 | 4GB R-ECC DDR3-1333 SDRAM x6 | 4GB R-ECC DDR3-1333 SDRAM x6 | 4GB R-ECC DDR3-1333 SDRAM x6 |
| L1带宽(MB/s) | 47880.48 | 48167.88 | 55376.16 |
| L2带宽(MB/s) | 19604.64 | 14314.34 | 16757.55 |
| 内存带宽(MB/s) | 10116.61 | 6672.76 | 4485.09 |
| L1 Cache Latency(ns) | |||
| 32 Bytes Stride | 2 cycles 0.68 ns |
1.25 ns | 1.13 ns |
| L1 Algorithm Bandwidth(MB/s) | |||
| Compiler | 43072.25 | 34042.63 | 25201.96 |
| REP MOVSD | 43467.25 | 34864.10 | 25467.15 |
| ALU Reg Copy | 11949.09 | 12166.94 | 13093.65 |
| MMX Reg Copy | 22537.36 | 25698.47 | 25242.19 |
| SSE PAlign | 47773.13 | 48167.40 | 52826.21 |
| SSE2 PAlign | 47880.48 | 48167.88 | 55376.16 |
| L2 Cache Latency(ns) | |||
| 4 Bytes Stride | 3 cycles 1.02 ns |
1.25 ns | 1.13 ns |
| 16 Bytes Stride | 3 cycles 1.02 ns |
1.25 ns | 1.50 ns |
| 64 Bytes Stride | 8 cycles 2.73 ns |
3.75 ns | 4.51 ns |
| 256 Bytes Stride | 8 cycles 2.73 ns |
6.25 ns | 4.51 ns |
| 512 Bytes Stride | 7 cycles 2.39 ns |
6.25 ns | 4.89 ns |
| L2 Algorithm Bandwidth(MB/s) | |||
| Compiler | 18039.64 | 11609.57 | 11880.48 |
| REP MOVSD | 19604.64 | 12140.00 | 12536.88 |
| ALU Reg Copy | 8788.90 | 9273.71 | 8577.86 |
| MMX Reg Copy | 14083.83 | 12042.45 | 13408.31 |
| SSE PAlign | 18731.92 | 14314.34 | 16719.97 |
| SSE2 PAlign | 5833.93 | 14289.88 | 16757.55 |
| Memory Latency(ns) | |||
| 4 Bytes Stride | 3 cycles 1.02 ns |
1.67 ns | 1.13 ns |
| 16 Bytes Stride | 5 cycles 1.70 ns |
5.00 ns | 4.89 ns |
| 64 Bytes Stride | 22 cycles 7.50 ns |
20.00 ns | 19.17 ns |
| 256 Bytes Stride | 102 cycles 34.77 ns |
34.58 ns | 59.77 ns |
| 512 Bytes Stride | 117 cycles 39.88 ns |
81.24 ns | 68.04 ns |
| Memory Algorithm Bandwidth(MB/s) | |||
| Compiler | 9210.17 | 2872.77 | 3178.45 |
| REP MOVSD | 10116.61 | 2887.02 | 3220.23 |
| ALU Reg Copy | 8156.00 | 2654.29 | 2789.34 |
| MMX Reg Copy | 9306.18 | 2943.85 | 2972.91 |
| MMX Reg 3dNow | - | 6631.75 | - |
| MMX Reg SSE | 8781.26 | 6672.76 | 3978.53 |
| SSE PAlign | 8580.24 | 5765.46 | 4128.59 |
| SSE PAlign SSE | 9524.07 | 6611.10 | 4390.48 |
| SSE2 PAlign | 8560.83 | 5766.87 | 4326.42 |
| SSE2 PAlign SSE | 9555.13 | 6612.42 | 4441.71 |
| MMX Block 4kb | 7743.82 | 4450.46 | 4063.30 |
| MMX Block 16kb | 8321.35 | 4677.49 | 4479.88 |
| SSE Block 4kb | 7890.10 | 4441.71 | 4074.79 |
| SSE Block 16kb | 8355.86 | 4681.34 | 4485.09 |
基本上,与处理器结合最紧密的L1,或L2(在有L3的情况下)的延迟总是跟处理器频率密集相关的,从总体测试结果来看,Nehalem-EP Xeon X5570全面强于基准平台,不过有两项数值很奇怪:SSE2 PAlign的L1测试和L2测试,这个数值明显不正常。
1
第1页:Intel Nehalem-EP处理器首发深度评测第2页:Nehalem:Tick-Tock战略的产物第3页:Nehalem设计思想的转变:基于企业应用第4页:深入Nehalem微架构:核心区间划分第5页:深入Nehalem微架构:指令拾取第6页:深入Nehalem微架构:解码与循环流检测第7页:深入Nehalem微架构:乱序执行引擎第8页:深入Nehalem微架构:乱序执行单元第9页:深入Nehalem微架构:乱序存取单元第10页:深入Nehalem微架构:乱序存取单元第11页:深入Nehalem微架构:缓存子系统第12页:深入Nehalem微架构:缓存子系统第13页:深入Nehalem微架构:核外系统/IMC第14页:深入Nehalem微架构:核外系统/QPI第15页:深入Nehalem微架构:ccNUMA架构第16页:深入Nehalem微架构:超线程技术第17页:深入Nehalem微架构:ccNUMA、SMT与OS第18页:深入Nehalem微架构:虚拟化第19页:深入Nehalem微架构:SSE4.2指令集第20页:深入Nehalem微架构:制造工艺第21页:深入Nehalem微架构:长沟道晶体管技术第22页:深入Nehalem微架构:能耗比控制第23页:深入Nehalem微架构:能耗比控制第24页:小结:Nehalem架构的优势第25页:Nehalem-EP:处理器规格对照表 第26页:Nehalem座驾:Tylersburg芯片组结构第27页:Nehalem座驾:Tylersburg芯片组PCIExpress第28页:Nehalem座驾:Tylersburg芯片组QPI第29页:Nehalem座驾:Tylersburg芯片组其它特性第30页:Nehalem座驾:四种Tylersburg规格对照表第31页:实物图:Nehalem-EP最高型号Xeon X5570第32页:实物图:Tylersburg-EP芯片组第33页:实物图:Intel Nehalem-EP测试样机第34页:实物图:Intel Nehalem-EP测试样机第35页:实物图:Intel Nehalem-EP测试样机第36页:实物图:Intel Nehalem-EP测试样机第37页:测试环境与测试方法第38页:Nehalem-EP服务器对比测试平台第39页:软件测试信息、系统部件简介第40页:SiSoftware Sandra 2009处理器性能测试第41页:SiSoftware Sandra 2009缓存内存性能测试第42页:SPEC CPU 2006整数性能测试第43页:SPEC CPU 2006浮点性能测试第44页:ScienceMark缓存内存子系统性能测试第45页:CineBench R10性能测试第46页:Iometer磁盘子系统性能测试第47页:NetBench文件服务器性能测试第48页:Benchmark Factory数据库性能测试第49页:超线程能力对比测试:SiSoftware Sandra第50页:超线程能力对比测试:ScienceMark第51页:超线程能力对比测试:CineBench第52页:超线程能力对比测试:Iometer第53页:超线程能力对比测试:NetBench第54页:超线程能力对比测试:Benchmark Factory第55页:超线程能力对比测试:SPEC CPU 2006整数第56页:超线程能力对比测试:SPEC CPU 2006浮点第57页:Nehalem-EP平台功耗测试第58页:IT168评测中心观点
相关文章