【IT168评测中心】最近一段时间,我们测试了众多Quadro FX家族的新产品,包括第十代Quadro家族除FX5800之外的所有显卡。不过在测试之初,我们发现了一个问题——SPECviewperf软件下显卡的性能似乎有些奇怪,maya-02项目的成绩基本恒定。按照常理推断,随着显卡抗锯齿倍数的增加,性能应该出现逐渐下降的趋势,而不是现在大家看到的基本持平。
稳定的成绩看起来很奇怪
最初,我们以为是显卡个体的原因,因为我们在测试AMD FirePro显卡中并没有出现类似的情况。莫非是Quadro FX显卡自身的问题?我们随后又测试了包括Quadro FX4800在内的多款显卡,得到的结果居然一致。不同规格的显卡跑出了同样的成绩,看来应该是显卡设置出了问题。
Quadro FX家族“无一幸免”
针对这个问题,我们联系了NVIDIA中国区,并说明了具体情况。随后,NIVIDIA给出了明确的答复,并派出了一名工程师与我们交流。在NVIDIA的帮助下,我们找到了问题所在。
在测试过多款显卡的相关项目之后,我们认为出现“成绩恒定”这种情况并非是由于显卡个体造成的,而是软件设置的问题。同时,我们测试过的FirePro显卡并没有发现这样的问题,看来问题似乎出现在驱动中。
在驱动设置中,我们找到“Manage 3D Settings”选项,在对应的选项卡最后一行,有“Vertical sync”字样,它的英文全称为vertical synchronization,中文称为垂直同步。
提到垂直同步这个名字,许多对显卡稍有了解的朋友都不会觉得陌生,对于FPS游戏来说垂直同步的开关与性能密切相关。不过在这里,垂直同步也影响到了显卡的最终测试得分。
垂直同步是涉及到显卡和显示器的一个概念。在CRT显示器中,显示器上的所有图像都是一线一线的扫描上去的(无论是隔行扫描还是逐行扫描),因此显示器都有2种同步参数——水平同步和垂直同步。其中,水平同步信号决定了显示器画出一条横越屏幕线的时间,垂直同步信号决定了显示器从屏幕顶部画到底部,再返回原始位置的时间。换句话说,我们可以将垂直同步的数值理解为CRT显示器的刷新率。而对于LCD来说,由于成像原理不同,刷新率对于LCD来说并不重要,只是LCD厂商为了兼容显卡,将LCD的刷新率默认为60。
被测的戴尔Precision T5500工作站,搭配了液晶显示器
看过了垂直同步的概念,回到我们测试的环境中来,研究一下是什么影响了测试结果。在默认状态下,NVIDIA显卡驱动中的垂直同步选项是开启的,这样当显卡渲染完成某一图像之后,却没有垂直同步信号的到达,显卡无法绘制下一屏,只有等待垂直信号到达,才可以绘制。而如果我们关闭垂直同步,那么显卡和显示器无需等待垂直同步信号,就可以开始下一屏图像的绘制,自然可以完全发挥显卡的实力。
也就是说,由于测试中并没有关闭垂直同步的选项,那么在液晶显示器的环境下,测试成绩就会因液晶显示器的刷新率受到明显的影响。那么在开启、关闭垂直同步的不同状态下,两者的性能会有多大的差距呢?
为了验证垂直同步对于性能的影响有多大,我们依然使用Precision T5500工作站进行同平台下的对比测试。
测试平台、测试环境 | ||
测试分组 | ||
类别 | DELL Precision T5500 | |
处理器子系统 | ||
处理器 | 双路Intel Xeon X5550 | |
处理器架构 | Intel 45nm Nehalem | |
处理器代号 | Gainestown | |
处理器封装 | Socket 1366 LGA | |
处理器规格 | 四核 | |
处理器指令集 | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,SSE4.2,EM64T,VT | |
主频 | 2.66Ghz | |
处理器外部总线 | 2x QPI 3200MHz 6.40GT/s 单向12.8GB/s(每QPI) 双向25.6GB/s(每QPI) | |
L1 I-Cache | 4x 32KB 8路集合关联 | |
L1 D-Cache | 4x 32KB 4路集合关联 | |
L2 Cache | 4x 256KB 8路集合关联 | |
L3 Cache | 8MB 16路集合关联 | |
主板型号 | DELL | |
北桥芯片组(MCH) | Intel 5520 | |
北桥芯片特性 | 2xQPI VT-d Gen 2 | |
内存控制器 | 每CPU集成三通道R-ECC DDR3 1333 | |
2GB R-ECC DDR3 1066 SDRAM x6 | ||
系统磁盘子系统 | ||
磁盘控制器 | Intel ICH10R AHCI Controller | |
磁盘控制器规格 | AHCI /w NCQ SATA 3Gbps | |
磁盘控制器设置 | AHCI /w NCQ SATA 3Gbps | |
磁盘控制器驱动 | Intel Matrix Storage Manager 8.8.0.1009 | |
磁盘 | WD VelociRaptor WD1600HLFS | |
磁盘规格 | 10000RPM 160GB SATA 3Gbps NCQ 16MB Cache | |
磁盘设置 | SATA 3Gbps NCQ | |
图形子系统 | ||
NVIDIA Quadro FX 3800 | ||
显卡参数 | 1024 RAM | |
显卡驱动 | NVIDIA Quadro 182.65 WHQL for XP64 | |
软件环境 | ||
操作系统 | Microsoft Windows XP Professional x64 |
我们测试使用的是Quadro FX3800显卡,通过在开启/关闭垂直同步状态下的不同表现,查看两者的性能变化。
我们使用最新的EVEREST 5.02软件查看芯片组信息:
根据被测工作站的情况,我们选择以下列表中的部分测试软件进行测试。
Cinbench R10
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。
SPECapc for SolidWorks 2007
SPECapc for SolidWorks 2007是由SolidWorks开发的,用于帮助SolidWorks 2007用户快速评估自己的工作站系统的一个工具。它由VB和C语言编写而成,可运行在Windows XP 32/64bi操作系统上。测试过程中使用了大小不一的CAD/CAM solid模型,最大的模型是一个由313万个顶点组成的引擎。
SPECviewperf 9
SPECViewperf 9.0是是专业级、符合工业标准的 OpenGL 图形显示卡效能测试分析软件,其测试项目有六项:3dsmax、DRV、DX、Light、ProE、Ugs,包括软件执行效能仿真(3dsmax、ProE)、以及动画公园场景仿真(Light)..等等,可以产出相关的分析数据。
SPECviewperf 10
SPECviewperf 10是一款测试专业显卡在多个CAD/DCC应用程序中的OpenGL性能的软件,包括3ds max、CATIA、EnSight、Maya、Pro/ENGINEER、SolidWorks等。最新推出的SPECviewperf 10可以告知你在多少倍抗锯齿下显卡性能表现会低于无抗锯齿情况下的10%,并提供截图比较。
SPECapc for Maya 6.5 v1.0
Alias Maya是一款功能强大的软件,集3D建模、动画和渲染等功能于一身,被广泛应用于电影、电视、游戏开发、视觉设计等领域。SPECapc for Maya 6.5测试包括5个部分,总共采用了4种模型(狼人、手、蚂蚁和鱿鱼),分别测试了wireframe、Gouraud-shaded、texture、texture highlighted with a wireframe mesh、texture with wireframe mesh and control points模式下的性能。SPECapc for Maya 6.5相对于上一代的测试软件的最大改进是用glDrawElements取代了glArrayElement,具有更高的效率。
SPECapc for 3ds Max 9
SPECapc for 3ds Max 9是基于典型用户的使用情况设定的负载,在测试过程中会涉及到wireframe modeling、shading、texturing、lighting、blending、inverse kinematics、object creation and manipulation、editing、scene creation、particle tracing、animation 和 rendering。3ds Max 8支持OpenGL和DirectX 8.0/9.0 API。
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。
CineBench R10 | ||
---|---|---|
测试环境 | 垂直同步on | 垂直同步off |
显卡 | Quadro FX 3800 | Quadro FX 3800 |
CPU Benchmark | ||
Rendering (1 CPU) | 4018 CB-CPU | 4070 CB-CPU |
Rendering (x CPU) | 25210 CB-CPU | 24749 CB-CPU |
Multiprocessor Speedup | 6.27x | 6.08x |
OpenGL Benchmark | ||
OpenGL Standard | 6131 CB-GFX | 8119 CB-GFX |
CineBench R10可以测试显卡的OpenGL性能。从测试结果来看,开启垂直同步的成绩为6131,关闭之后成绩明显提升,达到了8119,增幅为32.4%。
SPECapc for SolidWorks 2007是由SolidWorks开发的,用于帮助SolidWorks 2007用户快速评估自己的工作站系统的一个工具。它由VB和C语言编写而成,可运行在Windows XP 32/64bi操作系统上。测试过程中使用了大小不一的CAD/CAM solid模型,最大的模型是一个由313万个顶点组成的引擎。
开启垂直同步下性能测试
关闭垂直同步性能测试
和之前的测试结果一样,关闭垂直同步之后性能也出现了提升,从最初的3.00分提升到了3.54分;测试时间由150.28秒下降到了132.44秒,提升幅度分别为18%和13%。
SPECapc for 3ds Max 9是基于典型用户的使用情况设定的负载,在测试过程中会涉及到wireframe modeling、shading、texturing、lighting、blending、inverse kinematics、object creation and manipulation、editing、scene creation、particle tracing、animation 和 rendering。3ds Max 9提供了32位/64位两种版本,我们使用的是32位版本。
从测试结果来看,两者性能表现最好的项目都是Direct3D模式,而且在这个项目中差距最小。差距最大的是OpenGL模式,性能提升接近20%。
SPECViewperf 9.0是专业级、符合工业标准的 OpenGL 图形显示卡效能测试分析软件,其测试项目有六项:3dsmax、DRV、DX、Light、ProE、Ugs,包括软件执行效能仿真(3dsmax、ProE)、以及动画公园场景仿真(Light)..等等,可以产出相关的分析数据。
差距明显的项目来了。这里,我们可以直观看出关闭垂直同步的性能提升,在maya-02和sw-01两个项目中,关闭之后性能分别达到了之前的4倍和3倍左右,其他项目也有不等的性能优势。只是在ligth-08这个项目中关闭垂直同步时成绩落后。
SPECviewperf 10是一款测试专业显卡在多个CAD/DCC应用程序中的OpenGL性能的软件,包括3ds max、CATIA、EnSight、Maya、Pro/ENGINEER、SolidWorks等。最新推出的SPECviewperf 10可以告知你在多少倍抗锯齿下显卡性能表现会低于无抗锯齿情况下的10%,并提供截图比较。
关闭垂直同步成绩
开启垂直同步成绩
SPECviewperf 10的结果并没有出乎我们的意料,和SPECviewperf 9的成绩类似,maya-02风头正劲,性能差距可以说是天壤之别。在多倍抗锯齿和多线程测试中,关闭垂直同步之后优势都很明显。
Alias Maya是一款功能强大的软件,集3D建模、动画和渲染等功能于一身,被广泛应用于电影、电视、游戏开发、视觉设计等领域。SPECapc for Maya 6.5测试包括5个部分,总共采用了4种模型(狼人、手、蚂蚁和鱿鱼),分别测试了wireframe、Gouraud-shaded、texture、texture highlighted with a wireframe mesh、texture with wireframe mesh and control points模式下的性能。SPECapc for Maya 6.5相对于上一代的测试软件的最大改进是用glDrawElements取代了glArrayElement,具有更高的效率。
在SPECapc for Maya 6.5的测试中,关闭垂直同步也获得了不错的性能提升,总得分的增幅为40%。
【IT168评测中心】我们在测试中发现SPECviewperf测试的maya-02项目得分近乎被锁定在了60,进而通过询问NVIDIA找到了问题所在,原来是垂直同步搞的鬼。虽然问题的解决方法很简单,但我们在其他媒体或者个人工作室所发表的Quadro显卡测试中经常会看到类似的事情,看来这个问题还存在着普遍性。值得一提的是,在AMD FirePro产品中则没有发现类似的问题,默认状态就可以达到良好的性能。
通过测试证明,关闭垂直同步的情况下,显卡的性能可以得到尽可能大的发挥,测试成绩显示相比开启状态来说,性能提升按照测试软件的不同有所变化,最高可以达到40%,最低也有13%。换句话说,如果开启垂直同步,我们将不能尽情体验Quadro 10代产品所带来的性能提升,显卡的表现也会有所打折。
不过需要提醒的是,正是因为垂直同步的存在,才能使得图形处理进程和显示器刷新率同步,使得画面平滑,使得画面稳定。取消了垂直同步信号,固然可以换来更快的速度,但是在图像的连续性上,性能势必会打折扣,可能会造成图像的缺失甚至造成画面黑屏。
总而言之,垂直同步的关闭所带来的性能是以牺牲画面质量为代价的,对于工作站用户来说,如何取舍就得看实际需要了。(完)