服务器 频道

首款推土机 戴尔四路64核心服务器首测

        【IT168 评测】再过几天就是中国农历传统的春节了,在这个阖家欢乐的日子里,按照国人的传统已经开始各种总结和评比,大家都在欢欢喜喜的迎接新春的到来。不过在国外的厂商看来,他们完全没有春节这个意识,因此年底我们的评测产品还是非常多。今天为大家介绍的是一款重磅产品,也是AMD在第四季度发布的,用于双路及多路应用的推土机平台。这次收到的是来自戴尔的产品,也是我们看到的首款搭配推土机处理器的四路服务器,它的型号为R815。

戴尔四路64核心服务器首测
戴尔R815服务器

  正如戴尔的其他产品一样,R815随着AMD处理器升级也进行了升级,实用的是最新的皓龙6274处理器,也就是几个月前AMD刚刚推出的推土机系列。在推土机发布会的现场,我们就看到了戴尔的这款产品,而能够在短短2个月的时间之内推出对应产品,可见戴尔与AMD的合作亲密性。

戴尔四路64核心服务器首测
戴尔四路64核心服务器首测
戴尔R815服务器

  戴尔R815服务器是一款2U规格的产品,但是凭借着深厚的技术研发实力,戴尔在2U的空间内做到了4路,同时还提供了对于6块2.5英寸SAS硬盘的支持和双电源冗余。这才是国际大厂的实力,一般的国内厂商不可能做到这一点。

戴尔四路64核心服务器首测
戴尔R815服务器前面板

  戴尔R815服务器的前面板也很有特色,延续了戴尔一贯的风格,提供了一个可视化的运行状态指示屏,还有前置的VGA接口。

戴尔四路64核心服务器首测
戴尔R815服务器内部

  打开服务器,戴尔R815服务器内部采用了全模块化的设计,通过导风罩加强了内部的散热。而且有趣的是,R815服务器的散热风扇并非设计在机身前,而是放在了后半部分靠近电源的位置。究竟这些设计有什么好处呢?请看下一节的拆解内容。

 

戴尔R815服务器内部拆解
戴尔R815服务器内部拆解
戴尔R815服务器内部

  戴尔R815服务器内部的设计可以用优雅来形容。在2U的空间内整合了4路处理器,本身就会有一定的设计难度,而戴尔为每颗处理器搭配了8条内存插槽。我们知道,推土机处理器的内存通道数量是4通道,因此8条内存槽只能算是刚刚满足需要。

戴尔R815服务器内部拆解
戴尔R815服务器内部
戴尔R815服务器内部拆解
戴尔R815服务器内部的风扇

  拆下风扇之后,我们看到了戴尔R815服务器的内部构造。4颗处理器两两排列,这也是我们第一次在2U服务器中看到四路的搭配。

戴尔R815服务器内部拆解
AMD皓龙6274处理器

  戴尔R815服务器所搭配的皓龙6274处理器使用了32nm工艺,主频为2.2GHz,拥有16个核心,功耗为115W。从推土机处理器开始,AMD采用了Units概念取代原有的核心Core概念,实际上就是将2个核心封装在了1个Unit里面,从此也就意味着AMD不可能再有奇数核心的产品了。

戴尔R815服务器内部拆解
戴尔R815服务器内部拆解
来自现代的8GB DDR4内存
戴尔R815服务器内部拆解
戴尔R815服务器内部拆解
服务器使用的MBE2073RC硬盘

  存储方面,戴尔R815服务器为每颗处理器搭配了32GB容量的DDR4内存,提供了6块2.5英寸SAS硬盘,单盘容量为73GB。

戴尔R815服务器内部拆解
戴尔R815服务器所使用的阵列卡,测试时组建RAID5阵列
戴尔R815服务器内部拆解
板载博通BCM5709网络芯片,支持4个千兆网卡接口
戴尔R815服务器内部拆解
板载显示及远程管理芯片
戴尔R815服务器内部拆解
戴尔R815服务器内部拆解
提供冗余的戴尔1100W电源

  戴尔R815服务器提供了2个1100电源作为冗余,对于四路服务器来说配置较高,需要大功率的电源支持才行。

  在2009年秋我们IT168评测中心网络实验室搬迁到新的机房之后,我们又对实验室的服务器测试平台进行了大幅度的升级,先是将已有的Cisco Catalyst 4506千兆交换机升级到3个模块,达到了一共120个千兆网络端口,还新购买了30台DELL PowerEdge T100服务器,配合原有的30台DELL PowerEdge SC430服务器以及30台PC作为网络测试的客户端,可以提供非常充足的测试压力。


网络实验室控制台

网络实验室机房

Cisco Catalyst 4506千兆交换机,120个千兆铜口

部分Dell PowerEdge SC430服务器

  在新的测试环境下,我们进一步完善了服务器性能测试方案:

  • SiSoftware Sandra v2011

  SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。从2007开始,Sandra的Arithmetic benchmarks增加了对SSE3&SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一,SiSoftware Sandra 2010对NUMA架构以及最新的Windows 7/Windows Server 2008 R2提供了更好的支持,此外测试项目和测试结果也有了略微的变化。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。

产品名称某品牌DL585服务器戴尔R815服务器
平台类型AMD Magny-CourAMD Bulldozer
处理器子系统
处理器型号AMD Opteron 6174AMD Opteron 6274
处理器架构AMD 45nm?Magny-CoursAMD 32nm Bulldozer
代号Magny-CoursInterlagos
处理器封装Socket G34Socket G34
核心/线程数量12/1216/16
主频2.1GHz2.2GHz
处理器指令集

MMX,SSE,SSE2,SSE3,SSSE4

MMX,SSE,SSE2,SSE3,SSSE4

L1 Code Cache12x 64KB
2路集合关联
-
L1 Data Cache12x 64KB
2路集合关联
-
L2 Cache12x 512KB
16路集合关联
-
L3 Cache10MB
96路集合关联
-
服务器主板
型号主板-DELL
主板芯片组AMD SR5690
AMD ID439D
AMD SR5670
AMD SP5100
子系统内存
控制器内存CPU集成四通道Unganged DDR3 1333CPU集成四通道Unganged DDR3 1333
内存类型4GB R-ECC DDR3 1333 SDRAM x248GB R-ECC DDR3 1333 SDRAM x16
存储子系统
磁盘控制器P410i/1GBPERC 6/E
磁盘控制器规格8xSAS 6Gbps6xSAS 6Gbps
控制器驱动LSI MegaSR
13.06.0212.2009
LSI MegaSR
13.06.0212.2009
型号数量硬盘富士通MBD2147RC x5富士通MBE2073RC x6
规格硬盘15000RPM
147GB
SAS 6Gbps
32MB Cache
15000RPM
74GB
SATA 6Gbps
16MB Cache
软件环境
操作系统Microsoft Windows Server 2008 Enterprise R2 x64Microsoft Windows Server 2008 Enterprise R2 x64

  本次我们测试的戴尔R815服务器是一款2U四路服务器,支持AMD最新的英特拉格斯处理器,搭配了AMD Opteron 6274处理器。这款产品最大的特点是对于四路的支持,这相比我们常见的2U服务器来说有了一倍计算性能的提升,而且在扩展方面戴尔R815服务器也非常优秀,多达6块磁盘及双冗余电源的配置都是同类产品所不具备的。简单来说,戴尔R815服务器提供了一个完善的高密度解决方案。

SiSoftware Sandra Pro Business 2011
产品名称某品牌DL585服务器戴尔R815服务器
平台类型四路Magny-Cours四路Bulldozer
Processor Arithmetic Benchmark
处理器算术运算测试
总计本地功效
-
412.13GOPS
总计本地功效对比速度-232.32MOPS/MHz
Dhrystone iSSE4.2
380.5GIPS
529GIPS
Dhrystone iSSE4.2 vs SPEED181.63MIPS/MHz298.20MIPS/MHz
Whetstone iSSE3
288.46GFLOPS
321GFLOPS
Dhrystone iSSE3 vs SPEED137.69MFLOPS/MHz180.99MFLOPS/MHz
Processor Multi-Media Benchmark
处理器多媒体测试
总计多媒体功效123.15MPixel/s1000MPixel/s
总计多媒体功效对比速度36.31kPixels/s/MHz570.42kPixels/s/MHz
Multi-Media Int x16 iSSE4.1
1.17GPixel/s
1340MPixel/s
Multi-Media Int x16 iSSE4.1 vs SPEED700.2MPixel/s520.79kPixel/s/MHz
Multi-Media Float x8 iSSE2384.4MPixel/s764.57MPixel/s
Multi-Media Float x8 iSSE2 vs SPEED556.67kPixels/s/MHz

297.3kPixels/s/MHz

Multi-Media Double x4 iSSE2334.23kPixels/s/MHz418.2MPixel/s
Multi-Media Double x4 iSSE2 vs SPEED183.48kPixels/s/MHz

162.62kPixels/s/MHz

Multi-Core Efficiency Benchmark
处理器效能测试
内联核带宽-12.76GB/s
内联核带宽对比速度-7.36MB/s/MHz
内联核延迟(越小越好)-0.1ns
内联核延迟对比速度(越小越好)-0.1ns/MHz
Java算数性能测试
总计 Java 功效-

242GOPS

总计 Java 功效对比速度-136.47MOPS/MHz
Dhrystone Java
-
508.46GIPS
Dhrystone Java对比速度-286.62MIPS/MHz
Whetstone Java
-
115.27GFLOPS
Whetstone Java对比速度-64.98MFLOPS/MHz
Java多媒体性能测试
总计多媒体Java功效-161.18MPixel/s
总计多媒体Java功效对比速度-90.86kPixels/s/MHz
多媒体整数 x1 Java
-
178.61MPixel/s
多媒体整数 x1 Java对比速度-7.55kPixels/s/MHz
多媒体浮点数 x1 Java
-
145.46MPixel/s
多媒体浮点数 x1 Java对比速度-81.99kPixels/s/MHz
多媒体双精度 x1 Java-148.1MPixel/s
多媒体双精度 x1 Java对比速度-83.49Pixels/s/MHz
.NET Arithmetic Benchmark
.NET算术运算测试
总计 .NET 功效-77GOPS
总计 .NET 功效对比速度-43.44MOPS/MHz
Dhrystone .NET
47GIPS
40.33GIPS
Dhrystone .NET vs SPEED21.32MIPS/MHz22.73MIPS/MHz
Whetstone .NET
148.1GFLOPS
147.28GFLOPS
Whetstone .NET vs SPEED67.32MFLOPS/MHz83.02MFLOPS/MHz
.NET Multi-Media Benchmark
.NET多媒体测试
总计多媒体.NET功效-109.55MPixel/s
总计多媒体.NET功效对比速度-61.75kPixels/s/MHz
多媒体整数 x1 .NET
182.8MPixel/s
213.9MPixel/s
多媒体整数x1 .NET vs SPEED83.09kPixels/s/MHz120.57kPixels/s/MHz
多媒体浮点数 x1 .NET
32.5MPixel/s
56.11MPixel/s
多媒体浮点数 x1 .NET vs SPEED14.77kPixels/s/MHz31.63kPixels/s/MHz
多媒体双精度 x1 .NET
102.84MPixel/s
94.34MPixel/s
多媒体双精度 x1 .NET vs SPEED46.74kPixels/s/MHz53.18kPixels/s/MHz

  可以看出相比上一代的处理器,新款皓龙6274处理器在性能上有了很大的改进,这些改进在运算方面,包括整数和浮点运算上的表现都非常明显。不过在类似多媒体应用中,两者的差距并没有那么大,而且我们采用的软件版本也有差异,只能看出一种性能的提升趋势。

SiSoftware Sandra Pro Business 2011
产品名称某品牌DL585服务器戴尔R815服务器
平台类型四路Magny-Cours四路Bulldozer
Memory Bandwidth Benchmark
内存带宽测试
总体内存性能-117.4GB/s
总体内存性能对比速度-105.83MB/sMHz
整数 B/F iSSE2 内存带宽35.54GB/s117GB/s
整数 B/F iSSE2 内存带宽对比速度27.28MB/s/MHz105.51MB/sMHz
整数 B/F iSSE2 内存带宽35.58GB/s117.76GB/s
整数 B/F iSSE2 内存带宽对比速度27.31MB/s/MHz106.15MB/sMHz
Memory Latency Benchmark
内存延迟测试
内存延迟(越小越好)92ns102.4ns
内存延迟对比速度 (越小越好)0.07ns/MHz0.06ns/MHz
速度因素 (越小越好)67.5063.20
内部数据高速缓存3clocks4clocks
二级板载高速缓存

16clocks

26clocks
三级板载高速缓存57clocks72clocks
Cache and Memory Benchmark
缓存及内存测试
缓存/内存带宽
408.35GB/s
488.44GB/s
缓存/内存带宽对比速度190.07MB/s/MHz200.07MB/s/MHz
速度因素(越小越好)27.9022.10
内部数据高速缓存1TB/s1240GB/s
二级板载高速缓存697.76GB/s481.64GB/s

  内存带宽方面的差距还是很大的,大约有3倍左右的性能提升。这主要是推土机新架构带来的变化,但是在缓存/内存带宽中,我们看到差距又变得很小。说明虽然绝对数值上新处理器有明显的优势,但是在整体的比率上两代产品的差距还不大。

  我们的测试服务器采用了6块富士通2.5英寸硬盘组建了RAID 5阵列,使用的是服务器自带的i阵列卡。2.5英寸硬盘同样提供了15000rpm,而且在单位空间内的计算密度更高,可以提供更好的IOps。


  戴尔R815服务器的成绩果然是很不错,我们看到它的读写IOps虽然并不高,但对于MBps来说有着近700Mbps的读写速度,这都是得益于戴尔强大的阵列卡及2.5英寸硬盘的功劳。

  本次我们评测的戴尔R815服务器是一款基于最新皓龙推土机架构的产品,新的架构带来的不仅仅是性能的提升,更有整体运算方式的改变。推土机架构的一大特点就是采用了全新的处理单元,这些处理单元在我们的测试中表现出了强劲的性能,同时内部的互联架构也使得内存带宽得到了有效的提升。根据测试结果显示,运算性能相比上一代的同类型产品提升了70%以上,内存带宽提升了3倍。这些变化势必会带来性能上的提升,从我们测试的结果来看戴尔R815服务器已经具备了强大的运算能力和出色的功耗控制,同时新皓龙所提供的更多物理核心对于多核心虚拟化应用也有着得天独厚的优势。

戴尔R815服务器评测总结
戴尔R815服务器

  当然,仅仅是性能提升还不足以体现出戴尔R815服务器的强大之处。这是我们见过的为数不多在2U标准高度内能够提供4路应用的设备,之前也看到过许多类似多节点或者四子星之类的产品,但是他们之间有着本质的差异。四路服务器是AMD皓龙处理器一个非常好的的应用平台,而2U的高度又使得这种优势得到了进一步的发挥,单位空间的计算密度更大,计算能力更强。借助于戴尔成熟的虚拟化技术,戴尔R815服务器无疑会成为2012年度企业高密度服务器的一个有效选择。

0
相关文章