服务器 频道

Intel四核处理器Clovertown性能评测(上)

    【IT168 专稿】[编者按] Intel的四核处理器至强5300发布已经有一个月了。为了让广大用户对Clovertown的性能有一个更清晰的了解,我们近期组织编译了国外网站www.2cpu.com的Micah "Hooz" Schmidt撰写的四核评测报告。日前,IT168评测中心也已对基于Clovertown的服务器系统进行了评测。相关评测报告敬请点击: 英特尔四核平台服务器全国首度评测

    Intel四核处理器Clovertown性能评测(上篇),内容包括:

Clovertown的定位
测试系统平台
CPU、内存子系统评测:SiSoft SANDRA 2007 SP1
多线程测试:PCMark 2005 Multi-threaded Tests

    Intel四核处理器Clovertown性能评测(下篇),内容包括:

风险管理应用测试:SunGard Adaptiv Credit Risk Analysis
金融分析应用测试:Black & Scholes Kernel
3D图像制作应用测试:CINEBENCH 9.5 (x64)
3D图像制作应用测试:3ds Max 8.0
3D图像制作应用测试:POV-Ray v3.7 beta 16a
多媒体应用测试:TMPGEnc Plus v2.524.63.181
JAVA应用性能测试:SPECjbb2005
每瓦特性能测试
平台总功耗测试

    11月份,Intel发布了代号为“Clovertown”的“四核”处理器至强5300,定位于服务器与工作站。尽管对手随后指责Intel并没有生产出真正的四核处理器, 只不过是跟最早的双核至强和奔腾D一样,把两颗双核处理器(core 2 架构)封装在一个Socket中而已。但我认为,虽然“Clovertown” 并不是一个全新的架构设计,但的确是第一款用在双路系统上的“四核”处理器——1个socket插槽上可安装四个处理器核心,更重要的是,现在它可以正式销售了。

    这几年,AMD K8架构的推出使Intel真正感受到了在主流市场上的被动。股东们喜欢市场份额,Intel 需要股东,所以Intel不得不开始重组、调整并重新设计产品。今年,从Bensley平台、基于酷睿架构的双核至强处理器到今天的“Clovertown”四核处理器,都让我们看到了Intel的决心和进展。相信这也会大大增加股东们的信心。

    可以说“Clovertown”是Bensley平台上Woodcrest处理器的替代产品,它采用2个双核核心,每两个核心共享一个大的、动态的二级缓存(四个核心,每个socket 上有2个缓存)。为了保持woodcrest 80W TDP的电源功耗路线,Clovertown的主频做了一定的降低(不是总线速率),改由双倍数目的核心来弥补主频的下降。

Clovertown的定位

    目前,最高频率的80W Clovertown(Xeon E5345)的价格与最高频率的80W Woodcrest(Xeon5160)相当。同样,其他两款80W的 Clovertown 与80W的 Woodcrest的成本也一致。对于那些喜欢多花点钱来获得更高性能的用户来说,Intel推出了120W 的频率为2.66GHz的Clovertown。另外,低电压版本的Clovertown 也将在明年初推出。Clovertown 和Woodcrest定位差异如下图所示:


 
    我想,英特尔之所以这样定价的理由有两个:首要的因素是为了从AMD手中抢回失去的份额,所以英特尔针对Clovertown采取了低价策略。其次,就目前的形势来看,理论上并不是所有人都需要四核处理器。为了避免内部竞争,Woodcrest与Clovertown的定位和功效应该是有所差别的。下面的评测结果会证实这一点。

测试系统平台

    跟上次Intel送来的woodcrest服务器相比,这次送测的四核服务器风扇少了些,噪音也小了很多。这款产品采用的仍然是S5000PSL主板。英特尔表示,在当初设计5000系列芯片组(Blackford/Greencreek)的时候,就已经把对四核的支持考虑进去了,所以从双核升级到四核不需要更换主板。另外,通过多通道总线设计,1333M/s的总线带宽对四核来说已经“足够”。但实际结果如何,还要看我们的测试。

1)测试系统平台配置

    现在,大家都很关心系统功耗和每瓦特性能。为了更好地对比这两个指标,我尽力在同一平台上使用三种不同的Intel处理器——除了处理器外,其他配置都是一样的。其中Dempsey处理器采用的是3.46GHz的工程样品,正式版本的CPU没有这个频率,所以我将其命名为“Xeon 50XX”。AMD方面,我选用的是当前速度最快的两颗Opteron 285处理器(2.6GHz,双核)、will DK88主机板和OCZ 内存。值得注意的是,940平台的性能比不上Socket F平台的性能,但我手头没有相应的socket F平台。测试系统平台配置情况如下图所示:

2)测试软件工具

    我使用了以下版本的软件来进行测试:

· SiSoft Sandra 2007 SP1
· Black & Scholes Kernel (Optimized x64, custom VS2005 compile)
· Autodesk''s 3ds Max 8.0
· SunGard Adaptiv Credit Risk Analysis 3.0
· Pegasys'' TMPGEnc Plus v2.524.63.181
· POV-Ray 3.70 beta 16a
· SPECjbb2005
· Futuremark''s PCMark05

    除了3ds Max列出的是三次得分中的最高值外,其他的测试结果均是三次测试得分的平均值。测试系统的桌面设置均为1024x768,32位彩色,75Hz 刷新率。所有测试中,在BIOS中调用最优默认值,Xeon50XX系统则打开了超线程。除了Black & Scholes kernel外,其他测试方法均能公开获得和重新编写。

CPU、内存子系统评测:SiSoft SANDRA 2007 SP1

    SiSoftware公司成立于1995年,是一家提供计算机系统分析、诊断和基准评测软件的公司。SANDRA是该公司的旗舰产品,于1997年发布并得到广泛应用。目前,全球有近500 家IT书籍出版商、杂志社和媒体网站采用SANDRA来分析计算机性能。在该公司官方网站上罗列了超过5000条对计算机硬件的历史测试记录。

    SANDRA可以图形化显示计算机的整体系统性能。但值得注意的是,由于它是一套综合性的测试工具,所以测试结果并不会总是和实际应用中的真实性能直接相关。但采用SANDRA做压力测试还是很不错的,可以让我们观察到系统性能的理论峰值。

1)CPU测试

    从理论上来说,Clovertown是将基于core架构的四核计算能力整合在了一起,总频率高达18.64GHz(2.33G*4Core*2CPU),使得Clovertown在SANDRA CPU和多媒体测试中表现相当抢眼,如上图。

2)内存带宽测试
 
    内存测试结果表明,在相同总线速率和相同系统配置的情况下,Clovertown的内存带宽峰值要比Woodcrest低很多。经过多次测试,我们得到的都是相同的结果。我想,导致内存带宽较低的原因很可能是Clovertown系统中有8个核心为争夺内存资源而打架。显然,在实际应用中,这种现象对系统性能的影响是非常值得进一步研究的。AMD方面,Opteron凭借独特的集成内存控制器的特性获得了很高的内存带宽,如果结合NUMA-aware操作系统,这一优势还会更加突出。

3)Cache/内存速度测试

    在测试Cache/内存速度时,我一般采用未编译的ACE linpack二进制代码,但是我们现在采用的CPU拥有较大的缓存,且大于Linpack最大的块文件(2MB)。幸好SANDRA有自带工具能在大块文件下来测量出缓存和内存的带宽。为了更好的反映出文件块不断增大时对带宽的影响,我将测试结果分成了两个图表来显示。

4)内存延迟测试

    Clovertown拥有很快且更多的Cache,这使得它在这项测试中表现不凡。但在SANDRA内存测试时,Clovertown的瓶颈问题却同样很明显,二者看起来明显相互矛盾。那么,让我们看看在线性内存延迟测试中,SANDRA测试的结果如何。如下图所示(也分成两段显示):

    如上图所示,与Woodcrest相比,Clovertown在延迟方面表现差强人意。也许正是这些额外的延迟导致了Clovertown在前面SANDRA内存带宽测试中的得分偏低。下面我们再来看看实际应用中的性能趋势。

多线程测试:PCMark 2005 Multi-threaded Tests

    PCMark 2005 可以帮助你可靠、简易地测试计算机的性能,发现系统的优势和瓶颈。借助PCMark05的测试结果,我们可以轻松地对现有系统进行最优化升级,或者最适合应用需要的计算机。事实上,简单易用的PCMark05提供的测试工具和方法可与专业测试相媲美。

    更准确的说,PcMark 的多线程测试应该是多任务测试。在下面的两个测试中,我们通过多个并行任务来模拟真实的应用情况。第一个测试运行2个应用,第二个运行4个运用。

    可见,在这些测试中Clovertown 的性能非常优异,值得注意的是,它的主频还是这四款CPU中最低的。美中不足的是,这个测试只扩展到了4个线程,在第二个测试当中,Clovertown的CPU负载为50%,而Opteron 和 Woodcrest处理器的负载均在100%。

    Intel四核处理器Clovertown性能评测(上篇)介绍了Clovertown、测试系统平台和CPU、内存子系统的性能,下篇将从应用的角度来看看Clovertown在金融证券、3D图像、多媒体、JAVA、功耗等方面的表现,请点击:Intel四核处理器Clovertown性能评测(下篇)。

0
相关文章