【IT168 评测】再过几天就是中国农历传统的春节了,在这个阖家欢乐的日子里,按照国人的传统已经开始各种总结和评比,大家都在欢欢喜喜的迎接新春的到来。不过在国外的厂商看来,他们完全没有春节这个意识,因此年底我们的评测产品还是非常多。今天为大家介绍的是一款重磅产品,也是AMD在第四季度发布的,用于双路及多路应用的推土机平台。这次收到的是来自戴尔的产品,也是我们看到的首款搭配推土机处理器的四路服务器,它的型号为R815。
戴尔R815服务器
正如戴尔的其他产品一样,R815随着AMD处理器升级也进行了升级,实用的是最新的皓龙6274处理器,也就是几个月前AMD刚刚推出的推土机系列。在推土机发布会的现场,我们就看到了戴尔的这款产品,而能够在短短2个月的时间之内推出对应产品,可见戴尔与AMD的合作亲密性。
戴尔R815服务器
戴尔R815服务器是一款2U规格的产品,但是凭借着深厚的技术研发实力,戴尔在2U的空间内做到了4路,同时还提供了对于6块2.5英寸SAS硬盘的支持和双电源冗余。这才是国际大厂的实力,一般的国内厂商不可能做到这一点。
戴尔R815服务器前面板
戴尔R815服务器的前面板也很有特色,延续了戴尔一贯的风格,提供了一个可视化的运行状态指示屏,还有前置的VGA接口。
戴尔R815服务器内部
打开服务器,戴尔R815服务器内部采用了全模块化的设计,通过导风罩加强了内部的散热。而且有趣的是,R815服务器的散热风扇并非设计在机身前,而是放在了后半部分靠近电源的位置。究竟这些设计有什么好处呢?请看下一节的拆解内容。
戴尔R815服务器内部
戴尔R815服务器内部的设计可以用优雅来形容。在2U的空间内整合了4路处理器,本身就会有一定的设计难度,而戴尔为每颗处理器搭配了8条内存插槽。我们知道,推土机处理器的内存通道数量是4通道,因此8条内存槽只能算是刚刚满足需要。
戴尔R815服务器内部
戴尔R815服务器内部的风扇
拆下风扇之后,我们看到了戴尔R815服务器的内部构造。4颗处理器两两排列,这也是我们第一次在2U服务器中看到四路的搭配。
AMD皓龙6274处理器
戴尔R815服务器所搭配的皓龙6274处理器使用了32nm工艺,主频为2.2GHz,拥有16个核心,功耗为115W。从推土机处理器开始,AMD采用了Units概念取代原有的核心Core概念,实际上就是将2个核心封装在了1个Unit里面,从此也就意味着AMD不可能再有奇数核心的产品了。
来自现代的8GB DDR4内存
服务器使用的MBE2073RC硬盘
存储方面,戴尔R815服务器为每颗处理器搭配了32GB容量的DDR4内存,提供了6块2.5英寸SAS硬盘,单盘容量为73GB。
戴尔R815服务器所使用的阵列卡,测试时组建RAID5阵列
板载博通BCM5709网络芯片,支持4个千兆网卡接口
板载显示及远程管理芯片
提供冗余的戴尔1100W电源
戴尔R815服务器提供了2个1100电源作为冗余,对于四路服务器来说配置较高,需要大功率的电源支持才行。
在2009年秋我们IT168评测中心网络实验室搬迁到新的机房之后,我们又对实验室的服务器测试平台进行了大幅度的升级,先是将已有的Cisco Catalyst 4506千兆交换机升级到3个模块,达到了一共120个千兆网络端口,还新购买了30台DELL PowerEdge T100服务器,配合原有的30台DELL PowerEdge SC430服务器以及30台PC作为网络测试的客户端,可以提供非常充足的测试压力。
网络实验室控制台
在新的测试环境下,我们进一步完善了服务器性能测试方案:
- SiSoftware Sandra v2011
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。从2007开始,Sandra的Arithmetic benchmarks增加了对SSE3&SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一,SiSoftware Sandra 2010对NUMA架构以及最新的Windows 7/Windows Server 2008 R2提供了更好的支持,此外测试项目和测试结果也有了略微的变化。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。
产品名称 | 某品牌DL585服务器 | 戴尔R815服务器 |
平台类型 | AMD Magny-Cour | AMD Bulldozer |
处理器子系统 | ||
---|---|---|
处理器型号 | AMD Opteron 6174 | AMD Opteron 6274 |
处理器架构 | AMD 45nm?Magny-Cours | AMD 32nm Bulldozer |
代号 | Magny-Cours | Interlagos |
处理器封装 | Socket G34 | Socket G34 |
核心/线程数量 | 12/12 | 16/16 |
主频 | 2.1GHz | 2.2GHz |
处理器指令集 | MMX,SSE,SSE2,SSE3,SSSE4 | MMX,SSE,SSE2,SSE3,SSSE4 |
L1 Code Cache | 12x 64KB 2路集合关联 | - |
L1 Data Cache | 12x 64KB 2路集合关联 | - |
L2 Cache | 12x 512KB 16路集合关联 | - |
L3 Cache | 10MB 96路集合关联 | - |
服务器主板 | ||
型号主板 | - | DELL |
主板芯片组 | AMD SR5690 AMD ID439D | AMD SR5670 AMD SP5100 |
子系统内存 | ||
控制器内存 | 每CPU集成四通道Unganged DDR3 1333 | 每CPU集成四通道Unganged DDR3 1333 |
内存类型 | 4GB R-ECC DDR3 1333 SDRAM x24 | 8GB R-ECC DDR3 1333 SDRAM x16 |
存储子系统 | ||
磁盘控制器 | P410i/1GB | PERC 6/E |
磁盘控制器规格 | 8xSAS 6Gbps | 6xSAS 6Gbps |
控制器驱动 | LSI MegaSR 13.06.0212.2009 | LSI MegaSR 13.06.0212.2009 |
型号数量硬盘 | 富士通MBD2147RC x5 | 富士通MBE2073RC x6 |
规格硬盘 | 15000RPM 147GB SAS 6Gbps 32MB Cache | 15000RPM 74GB SATA 6Gbps 16MB Cache |
软件环境 | ||
操作系统 | Microsoft Windows Server 2008 Enterprise R2 x64 | Microsoft Windows Server 2008 Enterprise R2 x64 |
本次我们测试的戴尔R815服务器是一款2U四路服务器,支持AMD最新的英特拉格斯处理器,搭配了AMD Opteron 6274处理器。这款产品最大的特点是对于四路的支持,这相比我们常见的2U服务器来说有了一倍计算性能的提升,而且在扩展方面戴尔R815服务器也非常优秀,多达6块磁盘及双冗余电源的配置都是同类产品所不具备的。简单来说,戴尔R815服务器提供了一个完善的高密度解决方案。
SiSoftware Sandra Pro Business 2011 | ||
产品名称 | 某品牌DL585服务器 | 戴尔R815服务器 |
平台类型 | 四路Magny-Cours | 四路Bulldozer |
Processor Arithmetic Benchmark 处理器算术运算测试 | ||
---|---|---|
总计本地功效 | - | 412.13GOPS |
总计本地功效对比速度 | - | 232.32MOPS/MHz |
Dhrystone iSSE4.2 | 380.5GIPS | 529GIPS |
Dhrystone iSSE4.2 vs SPEED | 181.63MIPS/MHz | 298.20MIPS/MHz |
Whetstone iSSE3 | 288.46GFLOPS | 321GFLOPS |
Dhrystone iSSE3 vs SPEED | 137.69MFLOPS/MHz | 180.99MFLOPS/MHz |
Processor Multi-Media Benchmark 处理器多媒体测试 | ||
总计多媒体功效 | 123.15MPixel/s | 1000MPixel/s |
总计多媒体功效对比速度 | 36.31kPixels/s/MHz | 570.42kPixels/s/MHz |
Multi-Media Int x16 iSSE4.1 | 1.17GPixel/s | 1340MPixel/s |
Multi-Media Int x16 iSSE4.1 vs SPEED | 700.2MPixel/s | 520.79kPixel/s/MHz |
Multi-Media Float x8 iSSE2 | 384.4MPixel/s | 764.57MPixel/s |
Multi-Media Float x8 iSSE2 vs SPEED | 556.67kPixels/s/MHz | 297.3kPixels/s/MHz |
Multi-Media Double x4 iSSE2 | 334.23kPixels/s/MHz | 418.2MPixel/s |
Multi-Media Double x4 iSSE2 vs SPEED | 183.48kPixels/s/MHz | 162.62kPixels/s/MHz |
Multi-Core Efficiency Benchmark 处理器效能测试 | ||
内联核带宽 | - | 12.76GB/s |
内联核带宽对比速度 | - | 7.36MB/s/MHz |
内联核延迟(越小越好) | - | 0.1ns |
内联核延迟对比速度(越小越好) | - | 0.1ns/MHz |
Java算数性能测试 | ||
总计 Java 功效 | - | 242GOPS |
总计 Java 功效对比速度 | - | 136.47MOPS/MHz |
Dhrystone Java | - | 508.46GIPS |
Dhrystone Java对比速度 | - | 286.62MIPS/MHz |
Whetstone Java | - | 115.27GFLOPS |
Whetstone Java对比速度 | - | 64.98MFLOPS/MHz |
Java多媒体性能测试 | ||
总计多媒体Java功效 | - | 161.18MPixel/s |
总计多媒体Java功效对比速度 | - | 90.86kPixels/s/MHz |
多媒体整数 x1 Java | - | 178.61MPixel/s |
多媒体整数 x1 Java对比速度 | - | 7.55kPixels/s/MHz |
多媒体浮点数 x1 Java | - | 145.46MPixel/s |
多媒体浮点数 x1 Java对比速度 | - | 81.99kPixels/s/MHz |
多媒体双精度 x1 Java | - | 148.1MPixel/s |
多媒体双精度 x1 Java对比速度 | - | 83.49Pixels/s/MHz |
.NET Arithmetic Benchmark .NET算术运算测试 | ||
总计 .NET 功效 | - | 77GOPS |
总计 .NET 功效对比速度 | - | 43.44MOPS/MHz |
Dhrystone .NET | 47GIPS | 40.33GIPS |
Dhrystone .NET vs SPEED | 21.32MIPS/MHz | 22.73MIPS/MHz |
Whetstone .NET | 148.1GFLOPS | 147.28GFLOPS |
Whetstone .NET vs SPEED | 67.32MFLOPS/MHz | 83.02MFLOPS/MHz |
.NET Multi-Media Benchmark .NET多媒体测试 | ||
总计多媒体.NET功效 | - | 109.55MPixel/s |
总计多媒体.NET功效对比速度 | - | 61.75kPixels/s/MHz |
多媒体整数 x1 .NET | 182.8MPixel/s | 213.9MPixel/s |
多媒体整数x1 .NET vs SPEED | 83.09kPixels/s/MHz | 120.57kPixels/s/MHz |
多媒体浮点数 x1 .NET | 32.5MPixel/s | 56.11MPixel/s |
多媒体浮点数 x1 .NET vs SPEED | 14.77kPixels/s/MHz | 31.63kPixels/s/MHz |
多媒体双精度 x1 .NET | 102.84MPixel/s | 94.34MPixel/s |
多媒体双精度 x1 .NET vs SPEED | 46.74kPixels/s/MHz | 53.18kPixels/s/MHz |
可以看出相比上一代的处理器,新款皓龙6274处理器在性能上有了很大的改进,这些改进在运算方面,包括整数和浮点运算上的表现都非常明显。不过在类似多媒体应用中,两者的差距并没有那么大,而且我们采用的软件版本也有差异,只能看出一种性能的提升趋势。
SiSoftware Sandra Pro Business 2011 | ||
产品名称 | 某品牌DL585服务器 | 戴尔R815服务器 |
平台类型 | 四路Magny-Cours | 四路Bulldozer |
Memory Bandwidth Benchmark 内存带宽测试 | ||
---|---|---|
总体内存性能 | - | 117.4GB/s |
总体内存性能对比速度 | - | 105.83MB/sMHz |
整数 B/F iSSE2 内存带宽 | 35.54GB/s | 117GB/s |
整数 B/F iSSE2 内存带宽对比速度 | 27.28MB/s/MHz | 105.51MB/sMHz |
整数 B/F iSSE2 内存带宽 | 35.58GB/s | 117.76GB/s |
整数 B/F iSSE2 内存带宽对比速度 | 27.31MB/s/MHz | 106.15MB/sMHz |
Memory Latency Benchmark 内存延迟测试 | ||
内存延迟(越小越好) | 92ns | 102.4ns |
内存延迟对比速度 (越小越好) | 0.07ns/MHz | 0.06ns/MHz |
速度因素 (越小越好) | 67.50 | 63.20 |
内部数据高速缓存 | 3clocks | 4clocks |
二级板载高速缓存 | 16clocks | 26clocks |
三级板载高速缓存 | 57clocks | 72clocks |
Cache and Memory Benchmark 缓存及内存测试 | ||
缓存/内存带宽 | 408.35GB/s | 488.44GB/s |
缓存/内存带宽对比速度 | 190.07MB/s/MHz | 200.07MB/s/MHz |
速度因素(越小越好) | 27.90 | 22.10 |
内部数据高速缓存 | 1TB/s | 1240GB/s |
二级板载高速缓存 | 697.76GB/s | 481.64GB/s |
内存带宽方面的差距还是很大的,大约有3倍左右的性能提升。这主要是推土机新架构带来的变化,但是在缓存/内存带宽中,我们看到差距又变得很小。说明虽然绝对数值上新处理器有明显的优势,但是在整体的比率上两代产品的差距还不大。
我们的测试服务器采用了6块富士通2.5英寸硬盘组建了RAID 5阵列,使用的是服务器自带的i阵列卡。2.5英寸硬盘同样提供了15000rpm,而且在单位空间内的计算密度更高,可以提供更好的IOps。
戴尔R815服务器的成绩果然是很不错,我们看到它的读写IOps虽然并不高,但对于MBps来说有着近700Mbps的读写速度,这都是得益于戴尔强大的阵列卡及2.5英寸硬盘的功劳。
本次我们评测的戴尔R815服务器是一款基于最新皓龙推土机架构的产品,新的架构带来的不仅仅是性能的提升,更有整体运算方式的改变。推土机架构的一大特点就是采用了全新的处理单元,这些处理单元在我们的测试中表现出了强劲的性能,同时内部的互联架构也使得内存带宽得到了有效的提升。根据测试结果显示,运算性能相比上一代的同类型产品提升了70%以上,内存带宽提升了3倍。这些变化势必会带来性能上的提升,从我们测试的结果来看戴尔R815服务器已经具备了强大的运算能力和出色的功耗控制,同时新皓龙所提供的更多物理核心对于多核心虚拟化应用也有着得天独厚的优势。
戴尔R815服务器
当然,仅仅是性能提升还不足以体现出戴尔R815服务器的强大之处。这是我们见过的为数不多在2U标准高度内能够提供4路应用的设备,之前也看到过许多类似多节点或者四子星之类的产品,但是他们之间有着本质的差异。四路服务器是AMD皓龙处理器一个非常好的的应用平台,而2U的高度又使得这种优势得到了进一步的发挥,单位空间的计算密度更大,计算能力更强。借助于戴尔成熟的虚拟化技术,戴尔R815服务器无疑会成为2012年度企业高密度服务器的一个有效选择。