【IT168 评测】在前几天的文章中,我们曾为大家介绍过Quadro K2200的评测内容(详情请见:英伟达全新Quadro K2200专业级显卡评测)。这是NVIDIA在去年发布的多款产品之一。而除了Quadro K2200之外,面向中端的产品还包括了Quadro K4200。作为中端的新贵,Quadro K4200在性能上有了全新的突破,下面我们就来看看Quadro K4200的具体表现。
▲Quadro K4200显卡
▲Quadro K4200显卡接口
从规格来看,Quadro K4200显卡拥有1344个CUDA核心,支持4GB GDDR5显存,支持 高级shader 5.0语言(完全可编程GPU, 支持OpenG 4.3L和DirectX 11,第三代降噪, OpenGL双buffer, 硬件3-D纹理, 高质量纹理过滤, 硬件OpenGL覆盖平面等。
对于性能方面的考察,我们主要分为子系统测试和应用性能测试。在子系统测试中我们按处理器、以及磁盘等各个子系统进行了分项测试,当然各子系统的测试成绩也是相辅相成,也需要其它子系统的支持,并非是完全独立的,只是对考察的子系统有所偏重而已。
处理器子系统测试
对服务器处理器子系统的考察,我们主要采用的是业界公认的SPEC 2006测试,该项测试通过对数十个典型应用程序的运行,来测试系统处理器子系统在应用中的整、浮点运算效率。SPEC 2006测试具有很好的开放性,因此在业界为广大用户所接受,可以利用这一公开的测试结果进行系统间运算性能的比较。
此外SiSoftware Sandra也有测试子项可用于处理器运算性能测试,其结果通常以每秒完成的指令数来表现。也可以用作不同处理器间运算效率的比较。
SiSoftware Sandra v2014
SiSoftware Sandra是一款可运行在32bit和64bit Windows上的分析软件,这款软件可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。从2007开始,Sandra的Arithmetic benchmarks增加了对SSE3&SSE4 SSE4的支持,在Multi-Media benchmark中增加了对于SSE4的支持,另外还升级了File System benchmark和Removable Storage benchmark两个子项目。对于新的硬件的支持当然也是该软件每次升级的重要内容之一,SiSoftware Sandra 2014对NUMA架构以及最新的Windows 7/Windows Server 2008 R2提供了更好的支持,此外测试项目和测试结果也有了略微的变化。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。
CINEBENCH R15性能测试
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL.
值得一提的是,原来的CineBench R10已经不能再适应如今的测试需要,因为R10只能支持24个处理器核心,只有R15能够支持最多48个核心。
SiSoftware Sandra软件我们常用的处理器计算性能测试软件。在至强E3新出现的时候,我们将这款软件升级到了2011版本。而如今,这款软件最新的版本是2014,也只有此版本可以更好的支持至强处理器。虽然是Lite版本,但是对于我们的测试来说并无大碍。
SiSoftware Sandra Pro Business 2014 | |
产品名称 | 惠普Z840工作站 |
平台类型 | Xeon E5-2600 v3 |
Processor Arithmetic Benchmark | |
总计本地功效 | 406.92 GIPS |
Dhrystone整数 AVX2 | 579 GIPS |
Whetstone浮点数 AVX | 340.66 GFLOPS |
Whetstone双精度浮点数 AVX | 240.1 GFLOPS |
Processor Multi-Media Benchmark | |
总计多媒体功效 | 505.7 MPixel/s |
多媒体整数 x32 AVX2 | 549.2 MPixel/s |
Multi-Media Long-int Native x16 AVX2 | 366 MPixel/s |
Multi-Media Quad-int Native x1 ALU | 6.28 MPixel/s |
多媒体浮点数 x16 FMA | 543.8 MPixel/s |
多媒体双精度浮点数 x8 FMA | 433 MPixel/s |
Multi-Media Quad-float Native x2 FMA | 26.12 MPixel/s |
Multi-Core Efficiency Benchmark | |
内联核带宽(越高越好) | 52.26 GB/s |
内联核延迟(越低越好) | 175.6ns |
.NET Arithmetic Benchmark | |
总计.NET功效 | 63.13 GOPS |
Dhrystone整数.NET | 25.88 GIPS |
Whetstone浮点数.NET | 134.6 GFLOPS |
Whetstone双精度浮点数.NET | 176.23 GFLOPS |
.NET Multi-Media Benchmark | |
总计多媒体.NET功效 | 101.11 MPixel/s |
.NET多媒体整数 | 159.73 MPixel/s |
Multi-Media Long-int .NET | 174.39 MPixel/s |
Multi-Media Quad-int .NET | 1.33 MPixel/s |
.NET多媒体浮点数 | 51 MPixel/s |
多媒体双精度浮点数 .NET | 126.72 MPixel/s |
Multi-Media Quad-float .NET | 5 MPixel/s |
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。
值得一提的是,原来的CineBench R10已经不能再适应如今的测试需要,因为R10只能支持24个处理器核心,只有R15能够支持最多48个核心。
CineBench测试对于主频相当敏感,我们可以看到单核心的成绩只有117 cb,而在多核心中的成绩也则提升到了2502 cb,超线程的虚拟核心比率为21.38 x。对于显卡来说,本次测试的成绩达到了126.56 fps。
2013年12月,SPEC发布了最新的SPECviewperf 12,这是一个庞大到比较独特的图形性能测试包,未展开之前的容量大约是3GiB,展开后需要占用数十GiB的空间,这说明它的是的数据规模极为庞大。此外,SPECviewperf12还首次引入了DirectX的测试项目。
这是我们测试的成绩,因为测试软件的原因,原本3200*1800的分辨率在软件中只显示了1900*1060。从测试结果来看,Quadro K4200在绝大多数项目中表现流畅,足够应付主流应用。
评测总结:本次我们测试的Quadro K4200显卡在性能方面相当强劲,在我们测试的结果来看,它能够适应绝大多数专业软件的运行,而且相比我们之前测试的其他品牌旗舰级产品也毫不逊色。从性价比的角度来说,我们觉得Quadro K4200显卡是一款非常值得选购的产品。