【IT168评测中心】每一次,Intel和AMD这样领导厂商的新品发布都让人充满了期待,特别是关于处理器及新架构的产品更是引领了下一代的潮流。不过从服务器产品的角度来说,虽然SNB处理器已经出了桌面版本,但是服务器版本的时间恐怕要到2011年年底了。相比之下,AMD的推土机还要更靠谱一些,据称最晚今年6月就可以看到了。
新产品山雨欲来风满楼,但目前还只能依靠现有的产品撑起门面,事实上对于服务器产品来说,去年刚刚发布的Westmere和Opteron 6100还正处于青年期。今天我们要介绍的,也就是应用AMD十二核心Magny-Cours的服务器曙光A840r-G。
曙光A840r-G四路服务器
本次我们看到的曙光A840r-G是一台应用4颗Magny-Cours核心的四路服务器。Magny-Cours核心我们曾在之前的文章中多次谈到过,这款处理器的最大特点是内部整合了12个物理核心,应用了最新的HT3.1总线。
曙光A840r-G前面板
前面板上的前置USB接口及系统状态指示灯
人性化的前置风扇提手
曙光A840r-G是一台四路4U机架式服务器,机身前面板可以看到明显的3组可热插拔系统风扇,同时送测产品还配备了8块2.5英寸SAS硬盘。
曙光A840r-G背面图
曙光A840r-G的背面设计比较简单,提供了双千兆网络接口(另外一个接口为远程控制接口)。值得一提的是它提供了2个PS/2键盘、鼠标接口,这对于使用老式KVM的用户来说很方便。供电方面,送测样机有两个千瓦电源互为冗余,同时最多可以扩展到4个电源,为服务器的稳定运行提供了保障。
由于接触得不多,四路服务器一直给我们一种神秘感,特别是许多厂商的四路机架服务器都是自行研发的,我们对于其内部设计也是充满了期待。下面大家就随我来一起看看曙光A840r-G的内部构造。
曙光A840r-G上面有一个巨大的导风罩,利于系统散热
摘掉导风罩之后的样子
曙光A840r-G的内部设计的确经过了自行研发,我们看到它通过一个大大的导风罩对于机箱内部的风道进行整理,这样有利于处理器、内存等部件的散热。
服务器内部的处理器及内存
我们看到,作为四路服务器,曙光A840r-G的内部布局非常紧密,大家最容易看到的就是四个巨大的处理器散热器及数量众多的内存。就这台送测产品来说,曙光搭配的是AMD皓龙6174处理器,也是皓龙6100系列的中高端产品。内存方面,每处理器搭配的8条内存插槽都已经插满了,一共是4*8*4=128GB内存容量。
12个物理和核心的皓龙6174处理器,看起来有些狭长
马尼库尔处理器使用的Socket G34插槽
Magny-Cours晶圆图
从Magny-Cours核心开始,AMD在服务器平台上全面转向了DDR3内存,同时“千年不变”的处理器插槽也更换成了G34。这样一来,服务器平台就完全过渡到了DDR3时代,配合内存控制器的全面采用,服务器的内存性能得到了明显的提升,这次Magny-Cours的推出更是赢得了“最多核心X86处理器”的桂冠。虽然是目前物理核心数量最多的X86处理器,但是很显然Magny-Cours的推出时机并不是很好,而且即便是普及起来也需要一个相当的过程,不然AMD的CEO也不会因为这个原因在前几天离职了。
48个处理器核心,好壮观
我们之前介绍过,AMD的十二核心Magny-Cours和四核心上海、六核心伊斯坦布尔一样基于K10 Greyhound+增强型架构,由GlobalFoundries采用45nm SOI工艺制造,每个核心搭配512KB二级缓存,每六个核心共享6MB三级缓存、总计12MB,整个处理器拥有四条速度为6.4GT/s的HT 3.0总线,以及DDR3-1333内存控制器。
看过了Magny-Cours处理器,我们再来关心一下服务器当中的其他配件,它们帮助Magny-Cours发挥更好的性能。
曙光A840r-G搭配了32根三星4GB DDR3内存
正如我们刚刚提到的,在升级到Magny-Cours之后,AMD对其处理器平台也进行了革新,其中的内存控制器支持到了DDR3 1333规格,使得主板也提供了对于DDR3内存的支持。这样一来,曙光A804r-G就搭配了32根DDR3 1333内存。
曙光A840r-G搭配希捷万转硬盘
出于控制体积和提高单位空间计算密度的考虑,本次测试的曙光A840r-G搭配了8块希捷Savvio 10K.3硬盘,这也是目前希捷在2.5英寸SAS硬盘中的主力产品。测试的硬盘型号为ST9146803SS,这款硬盘的传输速率达6Gbps,转速10000RPM,缓存为16MB。
曙光A840r-G服务器的阵列卡
俗话说好马配好鞍,有了性能强大的磁盘,我们还需要一款不错的阵列卡。曙光A840r-G服务器搭配的依然是我们熟悉的LSI阵列卡,看样子有点像我们之前测试过的MegaRAID SAS 9260-8i,同样也支持最大8个SAS硬盘,支持RAID 0/1/5/6阵列。
曙光A840r-G提供双电源冗余
电源最大功率为1000W,并符合80Plus标准
曙光A840r-G服务器搭配的是3Y Power Technology的电源,这个电源品牌在我们测试过的服务器中并不常见。电源的型号为YM-2102B,符合80Plus银牌标准。根据80Plus机构提供的资料来看,在100%负载下这款电源的转换率接近90%,这个成绩对于四路服务器这样的耗电大户来说非常可观。这样长期积累下来相比普通的电源可以节省不少的电能,而1000W的最大功率也足够使用了。
随后,我们来看看曙光A840r-G服务器的主要芯片。作为一台四路服务器来说,扩展能力、网络能力都是我们关注的重点,后者也与它的性能表现有着密切的关系。
扩展插槽
作为一台四路服务器,曙光A840r-G的扩展插槽并不是很多。我们知道,主板使用的芯片是AMD自家的SR5690,这款芯片支持最多42个PCI-Express通道 ,支持PCI Express x16+PCI Express x16。从图上来看,我们只看到了一个PCI-E x16的插槽,其他三个都是PCI-E x8插槽,正好符合SR5690的通道数量。由于4U机架的体积比较大,这里曙光就没有使用扩展卡。
板载的显卡与远程管理芯片
这个是我们在国产服务器中常见的ASPEED AST2050芯片。它是支持IPMI 2.0的iKVM模块芯片,集成200MHz的ARM926EJ处理器和32KB L1缓存(16K+16K),其下方的Qimonda芯片是其运行内存(同时这款芯片也具备了显示功能,可谓是一举两得)。
Intel千兆网络芯片
和许多常见的国产服务器一样,曙光A840r-G板载了两个Intel G82576EB千兆网络芯片,这是一种成熟的千兆网络解决方案。
至此,我们对于曙光A840r-G服务器的外观介绍及内部拆解就结束了。从以上的内容来看,曙光A840r-G服务器在搭配了最新一代的皓龙6174之后性能非常彪悍,而且还有高达128GB容量的内存助阵,我们希望它在下面的测试中会取得不错的成绩。
在2009年秋我们IT168评测中心网络实验室搬迁到新的机房之后,我们又对实验室的服务器测试平台进行了大幅度的升级,先是将已有的Cisco Catalyst 4506千兆交换机升级到3个模块,达到了一共120个千兆网络端口,还新购买了30台DELL PowerEdge T100服务器,配合原有的30台DELL PowerEdge SC430服务器以及30台PC作为网络测试的客户端,可以提供非常充足的测试压力。
网络实验室控制台
在新的测试环境下,我们进一步完善了服务器性能测试方案:
SiSoftware Sandra v2010
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。从2007开始,Sandra的Arithmetic benchmarks增加了对SSE3&SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一,SiSoftware Sandra 2010对NUMA架构以及最新的Windows 7/Windows Server 2008 R2提供了更好的支持,此外测试项目和测试结果也有了略微的变化。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。
CineBench R11.5
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,在服务器测试平台中显示子系统不重要,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。
NetBench v7.03
NetBench是针对文件服务器的性能测试软件,影响NetBench性能的主要是服务器的磁盘子系统,服务器磁盘控制器、条带大小、读写缓存、硬盘类型、组建磁盘阵列模式、内存容量、网络拓朴结构等都会对测试结果有明显的影响。我们在被测服务器上设立了文件服务器,NetBench通过网络实验室中60个客户端来模拟网络中的PC向文件服务器所发出的文件传输请求,文件服务器则将存储在磁盘上的文件数据发送给相应的客户端。在测试过程中,客户端会以每四台一组的步进依次增加并且向服务器发送文件传输请求,测试结束后控制台收集数据并绘制出服务器的数据传输变化曲线。
Iometer 2006.7.27
Iometer是一款功能非常强大的IO测试软件,它除了可以在本机运行测试本机的IO(磁盘)性能之外,还提供了模拟网络应用的能力。在这次的测试中,我们仅仅让它在本机运行测试服务器的磁盘性能。为了全面测试被测服务器的IO性能,我们分别选择了不同的测试脚本。
Max_throughput(read):文件尺寸为64KB,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取吞吐量
Max_IO(read):文件尺寸为512B,100%读取操作,随机率为0%,用于检测磁盘系统的最大读取操作IO处理能力
Max_throughput(write):文件尺寸为64KB,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入吞吐量
Max_IO(write):文件尺寸为512B,0%读取操作,随机率为0%,用于检测磁盘系统的最大写入操作IO处理能力
本次评测的曙光A840r-G服务器配置的是四路AMD Opteron 6174处理器,这是目前的优异产品,性能非常强劲。测试对比平台的详细参数如下:
曙光A840r-G服务器 | |
处理器子系统 | |
---|---|
处理器型号 | 四路AMD Opteron 6174 |
处理器架构 | AMD 45nm Magny-Cours |
代号 | Magny-Cours |
核心/线程数量 | 12/12 |
主频 | 2.2GHz |
处理器指令集 | MMX,SSE,SSE2,SSE3,SSSE4 |
外部总线 | 2600MHz |
L1 Code Cache | 12x 64KB 2路集合关联 |
L1 Data Cache | 12x 64KB 2路集合关联 |
L2 Cache | 12x 512KB 16路集合关联 |
L3 Cache | 10MB 96路集合关联 |
主板 | |
主板型号 | A840r-G |
芯片组 | AMD SR5690 AMD ID439D |
北桥芯片特性 | - |
内存控制器 | 每CPU集成四通道Unganged DDR3 1333 |
配置内存类型 | 4GB R-ECC DDR3 1333 SDRAM x32 |
存储子系统 | |
磁盘控制器 | LSI MegaRAID SAS 9260-8i |
磁盘控制器规格 | 8x SAS 3Gb/s RAID 0/1/5/6 |
磁盘控制器驱动 | LSI MegaSR 13.06.0212.2009 |
硬盘 | Seagate Savvio 10K.3 ST3146803SS |
硬盘规格 | 10000RPM 146GB SAS 6Gb/s 16MB Cache |
软件环境 | |
操作系统 | Microsoft Windows Server 2008 R2 Enterprise Edition x64 |
应该说,从硬件规格来看,这款服务器使用的都是12核心的皓龙6100系列处理器,主频达到了2.2GHz,其次就是曙光这台A840r-G服务器搭配了128GB容量内存,为服务器的稳定运行提供了充足的空间。而LSI阵列卡和8块2.5英寸SAS硬盘的搭配,也为它的磁盘性能及稳定性提供了保障。
Opteron 6174,虽然是45nm工艺,但却提供了12个核心,主频较低,只有2.2GHz
依然是10MB三级缓存
对于为什么Magny-Cours核心标称的12MB三级缓存只有10MB,我们在之前惠普DL585 G7服务器的评测文章中进行过解释。这是因为在主板的设置选项中,有一个名为HT Assist的功能,全称为Hyper Transport(HT) Assist。HT Assist需要保留1MB三级缓存作为一个目录,用于跟踪系统其它地方使用的缓存行。所以当我们开启HT Assist功能的时候,每6MB三级缓存(也就是Istanbul的缓存)就要分配1MB给HT Assist,从而造成了12MB缓存只有10MB的局面。
主板使用的依然是我们熟悉的SR5690北桥
系统显示有131GB的内存,实际内存数量是128GB,有些差异属于计算问题
和我们常见的Nehalem或Westmere核心不同,Magny-Cours核心虽然支持DDR3内存,却是双通道或四通道的。这里,我们测试的皓龙6174处理器就支持四通道内存,只是软件依然显示是双通道。
主板一共提供了32条内存插槽,全部插满了三星4GB DDR3 1333内存
一屏已经显示不下的处理器容量,实际应该有48个
主板北桥芯片
处理器整合的内存控制器(依然显示双通道)
处理器南桥芯片
系统内存容量
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,它可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。我们利用了其中多个性能测试模块对于被测系统的性能进行了快速的测试。
SiSoftware Sandra Pro Business 2010 | |
---|---|
测试对象 | 曙光A840r-G服务器 |
Processor Arithmetic Benchmark 处理器架构测试 | |
Dhrystone ALU | 409GIPS |
Dhrystone ALU vs SPEED | 185.94MIPS/MHz |
Whetstone iSSE3 | 301.44GFLOPS |
Dhrystone iSSE3 vs SPEED | 137.02MFLOPS/MHz |
Processor Multi-Media Benchmark 处理器多媒体测试 | |
Multi-Media Int x16 iSSE4.1 | 1.22GPixel/s |
Multi-Media Int x16 iSSE4.1 vs SPEED | 556.07kPixels/s/MHz |
Multi-Media Float x8 iSSE2 | 727.2MPixel/s |
Multi-Media Float x8 iSSE2 vs SPEED | 330.54kPixels/s/MHz |
Multi-Media Double x4 iSSE2 | 399.48MPixel/s |
Multi-Media Double x4 iSSE2 vs SPEED | 181.58kPixels/s/MHz |
.NET Arithmetic Benchmark .NET架构测试 | |
Dhrystone .NET | 47GIPS |
Dhrystone .NET vs SPEED | 21.32MIPS/MHz |
Whetstone .NET | 148.1GFLOPS |
Whetstone .NET vs SPEED | 67.32MFLOPS/MHz |
.NET Multi-Media Benchmark .NET多媒体测试 | |
Multi-Media Int x1 .NET | 182.8MPixel/s |
Multi-Media Int x1 .NET vs SPEED | 83.09kPixels/s/MHz |
Multi-Media Float x1 .NET | 32.5MPixel/s |
Multi-Media Float x1 .NET vs SPEED | 14.77kPixels/s/MHz |
Multi-Media Double x1 .NET | 102.84MPixel/s |
Multi-Media Double x1 .NET vs SPEED | 46.74kPixels/s/MHz |
四路平台在这里表现出了强大的性能,这里的成绩与我们之前测试的至强5600系列产品比较接近。
SiSoftware Sandra缓存内存测试主要包括内存带宽、内存延迟等性能的测试。
SiSoftware Sandra Pro Business 2010 | |
---|---|
测试对象 | 曙光A840r-G服务器 |
Int Buff'd iSSE2 Memory Bandwidth | 35.54GB/s |
Int Buff'd iSSE2 Memory Bandwidth vs. Speed | 27.28MB/s/MHz |
Float Buff'd iSSE2 Memory Bandwidth | 35.58GB/s |
Float Buff'd iSSE2 Memory Bandwidth vs. Speed | 27.31MB/s/MHz |
Memory Latency Benchmark 内存延迟测试 | |
Memory(Random Access) Latency (越小越好) | 92ns |
Speed Factor(越小越好) | 67.50 |
Internal Data Cache | 3clocks |
L2 On-board Cache | 16clocks |
L3 On-board Cache | 57clocks |
Cache and Memory Benchmark 缓存及内存测试 | |
Cache/Memory Bandwidth | 408.35GB/s |
Cache/Memory Bandwidth vs SPEED | 190.07MB/s/MHz |
Speed Factor(越小越好) | 27.90 |
Internal Data Cache | 1TB/s |
L2 On-board Cache | 697.76GB/s |
内存测试项目中,皓龙6174处理器提供了四通道的设计,而容量巨大的内容也彻底避免了系统瓶颈。从这些角度来说,这台服务器为我们提供了强大的内存处理能力,包括缓存能力也有了明显的加强。
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。
曙光A840r-G服务器测试成绩
CinBench R11.5测试我们主要观察处理器项目的内容。这里,单核心的成绩为0.65 pts,多核心成绩为17.29 pts,这其中12个物理核心使得性能表现得到了明显的提升,MP Ratio成绩为26.61x,这个数值是我们在之前产品中没有看到过的。
我们测试的A840r-G服务器采用了8块希捷Savvio 10K.3硬盘组建了RAID 5阵列,使用的是服务器自带的LSI阵列卡。2.5英寸硬盘虽然在转速上并非是目前最快的,但是它却可以提供更好的IOps。
借助于LSI阵列卡所提供的RAID 5模式,曙光A840r-G的磁盘性能很强悍,IOps成绩接近80000;而在读写速度测试中,高达500Mbps的成绩也很出色。。
NetBench 7.03 Ent_dm.tst测试脚本模拟的是企业级文件服务器应用,它不但要求被测服务器的磁盘子系统可以提供足够的吞吐量,还需要其具有较高的IO处理能力,并且需要较为平衡的读取能力和写入能力。
NetBench性能测试
Netbench主要模拟的是文件服务器性能,考察项目包括磁盘的IO性能和网络的吞吐量。从这台曙光A840r-G的表现来看,它的性能峰值接近1900MB,成绩非常不错。
我们利用UNI-T UT71E智能数字万用表和相配套的软件对于对于被测服务器在几种不同的状态下的功耗进行了监测,主要包括如下项目:
P1:连接电源但不开机状态
P2:系统启动完毕,5分钟内无动作,但不休眠
P3:系统启动完毕,处理器满载(CPU占用率100%)工作
我们在三种情况下对于服务器在关机、待机和满载三种不同状态下的功耗进行了测试。结果显示,在加电关机状态下,服务器的功耗只有53W,看来四路机器的功耗的确比较高。在开机无动作一段时间之后(不休眠),服务器的功耗为390W,这几乎达到了主流双路服务器的峰值功耗。在满载状态下,A840r-G服务器的功耗为802W,一个听起来很恐怖的数值,但是对于满配的四路产品来说还可以接受,还不到一台标配电源的最大输出功率。而且由于使用的80Plus认证的银牌电源,已经使得A840r-G的整体功耗降低了很多,看来80Plus对于服务器,特别是多路大功率的服务器来说还是非常有必要的。
【IT168评测中心】本次我们收到的测试样机是曙光A840r-G四路机架式服务器,这也是目前为数不多的使用AMD皓龙6100处理器,也就是我们常说的Magny-Cours马尼库尔的产品。对于这款当今核心数量最多的X86服务器,我们也是充满了期待,对它的表现非常好奇。
曙光A840r-G四路机架式服务器
曙光A840r-G四路机架式服务器能够满足用户对虚拟化、数据库、数据仓库、大型ERP/CRM、数据检索与挖掘、商业智能等高端应用的产品需求,是大型企业、政府、军队、医药、科研、教育、石油、电力等机构的首选产品。
就我们测试的内容来看,曙光A840r-G服务器能够支持四路AMD皓龙Opteron 6174处理器,而且借助于AMD最新的平台及DDR3内存的支持,A840r-G表现出了不错的性能,整数运算和浮点运算成绩都很优秀。磁盘方面,2.5英寸万转SAS硬盘提供了很好的Iops成绩,Mbps成绩也突破了700,非常可观。我们实际测试了A840r-G的网络性能,从文件服务器的表现来看接近1900MB,已经非常出色了。