【IT168评测中心】宝通公司随着Xeon E5450处理器还送来了一款Xeon E5410,从数字上可以看出它是比较低端的型号,实际上它几乎是5400系列当中频率最低的处理器,只比5405要高一些。
Intel 45nm Xeon:5400系列
显然,宝通公司的意思是两款处理器高低搭配,不像E5450,只差一个数字的E5410价格低多了,很适合入门级服务器以及低端服务器选择,下面我们来看看E5410的性能测试报告,我们将会同多款处理器一起比较。测试方法和Xeon E5450处理器一样。
测试平台、测试对象介绍
DELL PowerEdge 2900 III测试平台 | |
主板 | DELL PE2900 BIOS:2.3.1 |
处理器 | Xeon E5410 x 2 |
主频 | 2.33GHz |
FSB | 1333MHz |
L1容量 | 64K(Data容量为32K) |
L2容量 | 12MB(共享) |
芯片组 | Intel 5000X |
内存 | 2GB FBD DDR2 667 SDRAM x 4 |
磁盘控制器 | DELL Perc 5/i RAID Controller |
系统硬盘 | Seagate Cheetah 15K.5 ST314655SS 146GB 16MB SAS x 3 |
阵列卡设置 | WriteBack, Cached I/O, Adapative Read Ahead |
硬盘设置 | RAID 5,条带大小64KB 主分区20GB,测试分区50GB |
网卡 | Broadcom BCM5708C千兆网卡 X 2 |
操作系统 | Windows Server 2003 R2 Enterprise Edition SP2 |
我们使用了一台安装了Windows Server 2003 R2操作系统的DELL PowerEdge 2900 III服务器作为测试平台,只是把处理器更换为我们的测试对象:E5410处理器。PowerEdge 2900 III服务器采用的主板基于Intel 5000X芯片组,带有12MB Snoop Filter缓存,它可以提升重负荷下缓存同步、进程调度方面的性能。5000X芯片组比较少见。前段时间推出的5400 Seburg芯片组带有24MB的Snoop Filter缓存。
对比平台包括我们PowerEdge 2900 III服务器原配的CPU:Xeon E5430以及Xeon E5450,除了它们的频率之外,其它和E5410没什么区别。此外还有一款AMD的Opteron 2356处理器。
Intel Xeon E5410处理器:
代号 | 型号 | SMP | 主频 | L2 | TDP | 制程 |
Harpertown | Xeon E5405 | DP | 2.00 | 12MB | 80W | 45nm |
Xeon E5410 | DP | 2.33 | 12MB | 80W | 45nm | |
Xeon E5420 | DP | 2.50 | 12MB | 80W | 45nm | |
Xeon E5430 | DP | 2.66 | 12MB | 80W | 45nm | |
Xeon E5440 | DP | 2.83 | 12MB | 80W | 45nm | |
Xeon E5450 | DP | 3.00 | 12MB | 80W | 45nm | |
Xeon E5460 | DP | 3.16 | 12MB | 120W | 45nm |
可以看出,45nm Xeon E5410的频率为2.33GHz,更低一个档次的E5405则为2.00GHz,相比之下E5410频率要高出16.7%,我们认为E5405的频率有些过低了。基本上,当前处理器都是同一系列当中频率最低的性价比高,不过在服务器当中,处理器的重要性比在桌面PC中的要高一些。
AMD 2356处理器:
AMD Opteron 2356处理器
AMD Opteron 2356 CPU-Z信息
就是一台送测样机中配备的四核心巴塞罗那处理器,其型号为AMD Opeteron 2356。这款处理器主频为2.3GHz,L2为512K,应用65nm工艺制造,也是最新的B3步进版本,功耗为75W。价格和频率都和Xeon E5410相似。
Intel E5410 ScienceMark 2.0测试界面
ScienceMark Membench | ||||
厂商 | DELL PE2900 III | DELL PE2900 III | DELL PE2900 III | Tyan GT24 (B2912) |
产品型号 | 双路 E5410 | 双路 E5430 | 双路 E5450 | 双路 Opteron 2356 |
内存技术参数 | 2GB FBD ECC DDR2 667 SDRAM x 4 | 2GB FBD ECC DDR2 667 SDRAM x 4 | 2GB FBD ECC DDR2 667 SDRAM x 4 | 1GB ECC DDR2 667 SDRAM x 4 |
内存带宽(MB/s) | 4485.77 | 4478.35 | 4505.59 | 5212.79 |
L1 Cache Latency(ns) | ||||
32 Bytes Stride | 1.29 | 1.13 | 1.00 | 1.30 |
L2 Cache Latency(ns) | ||||
4 Bytes Stride | 1.29 | 1.13 | 1.00 | 1.30 |
16 Bytes Stride | 1.72 | 1.50 | 1.34 | 1.30 |
64 Bytes Stride | 5.16 | 4.51 | 4.01 | 3.91 |
256 Bytes Stride | 5.16 | 4.51 | 4.01 | 6.52 |
512 Bytes Stride | 5.59 | 4.89 | 4.34 | 6.52 |
Algorithm Bandwidth(MB/s) | ||||
Compiler | 2949.75 | 2320.00 | 3177.97 | 1845.51 |
REP MOVSD | 2983.45 | 2324.80 | 3223.82 | 1844.30 |
ALU Reg Copy | 2551.17 | 1879.52 | 2818.10 | 1534.26 |
MMX Reg Copy | 2782.87 | 1896.39 | 2992.21 | 1820.91 |
MMX Reg 3dNow | --- | --- | --- | 5112.84 |
MMX Reg SSE | 3876.27 | 2688.02 | 3962.02 | 5148.49 |
SSE PAlign | 4265.40 | 2687.01 | 4297.17 | 4940.53 |
SSE PAlign SSE | 4052.10 | 2690.93 | 4124.61 | 5212.79 |
SSE2 PAlign | 4263.45 | 2688.09 | 4293.79 | 4940.73 |
SSE2 PAlign SSE | 4054.97 | 2691.79 | 4126.98 | 5211.16 |
MMX Block 4kb | 4139.45 | 2583.20 | 4167.14 | 3215.32 |
MMX Block 16kb | 4475.10 | 2310.93 | 4480.38 | 3354.92 |
SSE Block 4kb | 4080.12 | 2599.01 | 4172.21 | 3166.65 |
SSE Block 16kb | 4485.77 | 2313.20 | 4505.59 | 3339.01 |
首先我们进行的是ScienceMark的测试,主要考察系统的处理器和内存情况。L1/L2 Cache的成绩主要是跟处理器频率相关,因为目前的处理器当中L1 Cache都是和处理器核心同频率的,而L2 Cache基本上也是——当前的处理器L2都是全速的(放置在处理器内但不在同一个芯片上的Pentium II为半速L2,而Pentium之前的处理器L2则和处理器分离,速度更低)。越快的频率,L1/L2性能就越好。而内存带宽主要由两部分相关:比较大的部分是内存架构,小部分是内存操作指令(集),例如使用最新的SSE指令集比通常的ALU指令集会得到更大的吞吐量,而不同的SSE版本性能也有不同。
在架构的Xeon对比上,性能上的排序就跟价格上的排序一样。而由于架构上的不同,Xeon E5410和Opteron 2356各有所长,总体上靠着更为昂贵些的内存子系统,E5410具有较高的优势。
SiSoftware Sandra Pro Home 2008 | ||||
E5410 | E5450 | E5450 | OP2356 | |
Processor Arithmetic Benchmark | ||||
Dhrystone ALU | 86496 MIPS | 98883 MIPS | 110320 MIPS | 69732 MIPS |
Whetstone iSSE3 | 68156 MFLOPS | 78073 MFLOPS | 87861 MFLOPS | 59229 MFLOPS |
Processor Multi-Media Benchmark | ||||
Multi-Media Int x8 iSSSE3 | 515552 iit/s | 589298 iit/s | 655876 iit/s | 174694 iit/s |
Multi-Media Float x4 iSSE2 | 279994 fit/s | 320917 fit/s | 358011 fit/s | 230000 fit/s |
Memory Bandwidth Benchmark | ||||
Int Buff'd iSSE2 Memory Bandwidth | 6239 MB/s | 6259 MB/s | 6264 MB/s | 6569 MB/s |
Float Buff'd iSSE2 Memory Bandwidth | 6233 MB/s | 6259 MB/s | 6262 MB/s | 6494 MB/s |
Cache and Memory Benchmark | ||||
Cache/Memory Bandwidth | 64579 MB/s | 69276 MB/s | 75623 MB/s | 65611 MB/s |
.NET Arithmetic | ||||
Dhrystone .NET | 11156 .netMIPS | 12098 .netMIPS | 12358 .netMIPS | 12583 .netMIPS |
Whetstone .NET | 39208 .netMFLOPS | 45386 .netMFLOPS | 52176 .netMFLOPS | 37039 .netMFLOPS |
.NET Multi-Media | ||||
Multi-Media Int x1 .NET | 91402 .netiit/s | 104727 .netiit/s | 120421 .netiit/s | 79258 .netiit/s |
Multi-Media Float x1 .NET | 20800 .netfit/s | 23881 .netfit/s | 27648 .netfit/s | 16251 .netfit/s |
SiSoftware Sandra主要用于测试理论计算成绩,虽然通常和实际成绩有些差异,不过从这些成绩当中可以看出硬件/软件架构上的不同。从计算能力上看,E5410比OP2356要高出不少,特别是多媒体相关的计算。
NetBench测试的Ent_dm.tst测试脚本模拟的是企业级文件服务器应用,它不但要求被测服务器的处理器和内存子系统可以提供足够的运算能力和吞吐量,还需要磁盘子系统具有较高的IO处理能力。
由于磁盘子系统根本就不同,因此这里没有加入OP2356的成绩。
E5410 NetBench吞吐量
处理器的不同带来了测试结果的不同,大致上E5450的成绩的提升不及频率上的差异,也就是说E5410和E5450的成绩比较接近。
E5410静态页面性能
静态测试其实考量的是服务器的网络带宽——用来传输静态的页面并不太消耗其它资源,因此不同的处理器性能大都一样,在单千兆网卡的情况下,这个极限数值是18000请求每秒,OP2356平台略低一些,这跟其架构有关。
E5410动态页面性能
动态性能和CPU、内存有较大的关系,和磁盘也有一些关系,三款Xeon的成绩都很相似,表明其对频率不是非常敏感,相反对内存子系统的性能比较敏感,Opteron的内存架构更为优秀一些——处理器内置内存控制器。Intel最新的Nehalem平台也采用了这样的做法。
我们在被测的服务器上安装了Microsoft SQL 2005,按照测试要求建立了数据库,包括9个表,其中有4个500万行的表格,每行包括100字节的数据,因此每个表格容量大约是476MB,整个数据库容量为1.86GB。我们用60个客户端模拟1600个用户,在1-500的区间内以50个为一组依次增加,在这个数据库中进行查询、添加、删除、修改等操作。
SQL 2005性能
影响数据库性能的因素有很多,特别是在平台架构不相同的情况下。E5410的成绩和其他频率更高的Xeon处理器在重负荷下保持了相当的差距,相比之下,OP2356的平台随着负载的提升性能下降很快(数据比较多,需要仔细看才行)。
我们利用UNI-T UT71E智能数字万用表和相配套的软件对于对于被测服务器在几种不同的状态下的功耗进行了监测,主要包括如下项目:
P1:连接电源但不开机状态
P2:系统启动完毕,5分钟内无动作,但不休眠
P3:系统启动完毕,处理器满载(CPU占用率100%)工作
E5410功耗测试
Xeon平台只有处理器不同,因此功耗排序和处理器频率排序大致上相同,除了P1阶段绝对值较小而误差较大之外。Op2356平台的硬件差异较大(1U服务器,两颗巴塞罗那皓龙处理器2356、4GB DDR2 667MHz内存、1块3.5英寸SATA硬盘、5个系统风扇),而Xeon平台是一个较大的塔式服务器(8GB FBDDDR2 667、3块15000RPM SAS硬盘、多个大尺寸风扇),因此OP平台功耗很低,没有直接对比的价值。
【IT168评测中心】从性能上看,处理器在服务器的性能因素当中占据了比较重要的地位,只有少数如静态Web服务才不太依赖于处理器。其他的应用中,根据负载的不同,对处理器的依赖性也各有不同。
代号 | 型号 | SMP | 主频 | L2 | TDP | 制程 |
Harpertown | Xeon E5405 | DP | 2.00 | 12MB | 80W | 45nm |
Xeon E5410 | DP | 2.33 | 12MB | 80W | 45nm | |
Xeon E5420 | DP | 2.50 | 12MB | 80W | 45nm | |
Xeon E5430 | DP | 2.66 | 12MB | 80W | 45nm | |
Xeon E5440 | DP | 2.83 | 12MB | 80W | 45nm | |
Xeon E5450 | DP | 3.00 | 12MB | 80W | 45nm | |
Xeon E5460 | DP | 3.16 | 12MB | 120W | 45nm |
我们测试了Intel 45nm Xeon E5410,主频为2.33GHz,L2 Cache为12MB,FSB为1333MHz,集成了8.2亿晶体管,TDP为80W,除了频率,它和E5430、E5450等处理器没有什么差别。
从Intel的策略来看就是处理器价格提升的幅度要比频率提升幅度要高不少,E5410的价格不到2000元(单个处理器),性能上比E5450差20%~30%左右,对于不需要太高性能的用户来说,自然是价格越低越好,入门级别的低端服务器或者笔者这样的个人工作站使用是非常好的选择,特别是和桌面平台的Core 2处理器相比甚至还具有一些价格/性能优势,只是在主板、内存上会增加一定的成本。而对于“产出”的用户来说,硬件设备是为了更好地得到其他方面的价值(商业服务或者高附加值的创作等),对硬件的成本方面不太敏感,因此采用高频率的E5450(或者更高)会比较合适。