平滑过渡上海曙光A650服务器性能评测-服务器专区

平滑过渡上海曙光A650服务器性能评测

作者：IT168评测中心盘骏刘策编辑：盘骏 2008-12-16 09:25 来源：IT168�

　　ScienceMark v2.0 Membench

　　ScienceMark v2.0是一款用于测试系统特别是处理器在科学计算应用中的性能的软件，MemBenchmark是其中针对处理器缓存、系统内存而设计的功能模块，它可以测试系统内存带宽、L1 Cache延迟、L2 Cache延迟和系统内存延迟，另外还可以测试不同指令集的性能差异。

ScienceMark v2.0 Membench L1测试成绩

ScienceMark v2.0 Membench L2测试成绩

ScienceMark v2.0 Membench 内存测试成绩

　　首先我们进行的是ScienceMark的测试，主要考察系统的缓存和内存子系统情况。L1/L2 Cache的成绩主要是跟处理器频率相关，因为目前的处理器当中L1 Cache都是和处理器核心同频率的，而L2 Cache基本上也是——当前的处理器L2都是全速的（放置在处理器内但不在同一个芯片上的Pentium II为半速L2，而Pentium之前的处理器L2则和处理器分离，速度更低）。越快的频率，L1/L2性能就越好。而内存带宽主要由两部分相关：比较大的部分是内存架构，小部分是内存操作指令（集），例如使用最新的SSE指令集比通常的ALU指令集会得到更大的吞吐量，而不同的SSE版本性能也有不同。

ScienceMark Membench
厂商	Dawning	DELL
产品型号	AS650 AMD Barcelona Opteron 2350 2.0GHz	PowerEdge 2900 III Intel Harptown Xeon E5430 2.66GHz
内存技术参数	2GB R-ECC DDR2-667 SDRAM x4	2GB FBD-ECC DDR2-667 SDRAM x4
L1带宽(MB/s)	37069.97	55376.16
L2带宽(MB/s)	11523.46	16757.55
内存带宽(MB/s)	5144.71	4485.09
L1 Cache Latency(ns)
32 Bytes Stride	1.50	1.13
L1 Algorithm Bandwidth(MB/s)
Compiler	28354.58	25201.968
REP MOVSD	28986.14	25467.15
ALU Reg Copy	10804.26	13093.65
MMX Reg Copy	20285.37	25242.19
SSE PAlign	37003.99	52826.21
SSE2 PAlign	37069.97	55376.16
L2 Cache Latency(ns)
4 Bytes Stride	1.13	1.13
16 Bytes Stride	1.50	1.50
64 Bytes Stride	4.51	4.51
256 Bytes Stride	4.51	4.51
512 Bytes Stride	4.89	4.89
L2 Algorithm Bandwidth(MB/s)
Compiler	8830.23	118800.48
REP MOVSD	9964.34	12536.88
ALU Reg Copy	7660.43	8577.86
MMX Reg Copy	9754.61	13408.31
SSE PAlign	11523.46	16719.97
SSE2 PAlign	11502.38	16757.55
Memory Latency(ns)
4 Bytes Stride	2.00	1.13
16 Bytes Stride	8.00	4.89
64 Bytes Stride	31.00	19.17
256 Bytes Stride	97.49	59.77
512 Bytes Stride	107.99	68.04
Memory Algorithm Bandwidth(MB/s)
Compiler	1826.24	3178.45
REP MOVSD	1851.43	3220.23
ALU Reg Copy	1606.58	2789.34
MMX Reg Copy	1882.10	2972.91
MMX Reg 3dNow	5028.88	-
MMX Reg SSE	5106.97	3978.53
SSE PAlign	4720.15	4128.59
SSE PAlign SSE	5144.71	4390.48
SSE2 PAlign	4721.73	4326.42
SSE2 PAlign SSE	5144.15	4441.71
MMX Block 4kb	2940.43	4063.30
MMX Block 16kb	3201.03	4479.88
SSE Block 4kb	3087.78	4074.79
SSE Block 16kb	3245.74	4485.09

AMD 45nm Shanghai Opteron 2350的缓存架构，L3基于32路集合关联，并且容量只有2MB

Intel 45nm Harptertown Xeon E5430的缓存架构，L3基于24路集合关联

　　不得不说，直联架构的内存带宽是要高一些，而基本上，与处理器结合最紧密的L1，或L2（在有L3的情况下）的延迟总是跟处理器频率密集相关的，因此频率较高的Xeon平台在缓存方面就强一些。大容量的缓存在进行多任务处理器的时候会具有更高的效率。

第1页：直接支持上海曙光A650服务器性能评测第2页：曙光A650服务器外观介绍第3页：曙光A650服务器外观介绍第4页：曙光A650服务器内部组件解析第5页：曙光A650服务器内部组件解析第6页：测试环境与测试平台介绍第7页：测试方法介绍第8页：软件测试信息、系统部件简介第9页：SiSoftware Sandra 2009综合性能测试第10页：ScienceMark - 缓存内存子系统测试第11页：CineBench R10性能测试第12页：SPEC CPU 2006-处理器子系统性能测试第13页：IOmeter-磁盘子系统性能测试第14页：NetBench-文件服务器测试第15页：Benchmark Factory-数据库性能测试第16页：功耗测试第17页：IT168评测中心观点

关注我们

平滑过渡上海 曙光A650服务器性能评测

平滑过渡上海曙光A650服务器性能评测