【IT168评测中心】虽然现在的专业显卡和我们通常使用的普通显卡看起来差不多,不过由于面向的领域不同,因此它们也具有着很多不同点:最显眼的就是价钱了。所谓的专业卡,专业首先是因为其面向的应用专业。专业显卡所针对的领域就是诸如3D建模程序和计算机辅助设计系统这样的3D专业应用,不同于我们平时的3D游戏,这些程序需要以不同的方式调动显卡的运算资源。
粗略而言,一般三维设计可以包括建模、打光、贴图、材质和最终渲染这几步,大致上和现在显卡的结构:T&L加纹理单元一一对应,可以说,除了在前面说过的侧重点不同之外,专业卡和桌面卡都是为了将这些步骤进行硬件加速。最不相同的地方是最后一个阶段:渲染。专业三维设计的目的是为了“生产”三维图像,而游戏则是为了生成用户看到的三维游戏图像,为了达到电影级别的三维效果,通常专业三维设计的最终渲染都是由CPU来完成,而桌面显卡则使用的是由GPU生成的效果,因此人们常常会看到游戏画面远不如电影看到的效果那么逼真,尽管显示尺寸都一样。
除了提高创作效率之外,专业图形卡还必须对各种专用API、创作软件提供良好的支持,以及确保工作的稳定性。一般的图形卡则侧重于为游戏提供对应的兼容性。
由于通常情况下渲染结果其实由CPU生成,因此专业图形卡对三维设计的最终渲染表现不是十分明显,不过这个问题也不是一成不变,在前些年,还几乎没有对最终渲染进行硬件加速,因为当时的专业图形卡的可编程能力非常弱,渲染出来的结果往往和预计有着明显的差异——因此只能用于预览窗口的加速。而近些年来GPU可编程能力不断提升,如Direct3D和OpenGL这些的API也不断增强相关功能,GPU的渲染效果也开始能和CPU软件渲染相媲美了,而GPU渲染的速度则是CPU渲染的数十数百倍。
Ray Trace光线追踪是渲染中常用到的一种方法,经常一起出现的还有Radiosity(辐射渲染)算法,它们都是为了得到逼真的Global Illumination(全局照明)渲染效果(在游戏里面就不用想得到这些效果了),Ray Trace算法和Radiosity算法包含大量的有限元分析计算和迭代,传统的GPU对此毫无办法,只有最新的专业图形芯片才开始对其提供硬件支持:
NViRT(NVIDIA Interactive Ray Tracing,NVIDIA交互光线追踪)比起使用HLSL/GLSL更进一步:它通过CUDA来实现三维渲染硬件加速——效果更接近于CPU渲染,与目前为止的3D硬件渲染都不同。NVIDIA iRT可以解决渲染当中光栅化模式下的一些问题,比如说不规则曲面的实时反射的效果、特殊材质的光线折射的效果,另外还有诸如非直接照明等方面也是iRT技术的强项。如果使用传统的光栅化的方式,有些效果很难实现,或者需要花费非常多的资源才能实现。NVIDIA iRT是业界第一个真正可以投入实用的交互式的Ray Tracing技术,它可以容易的内置到各种应用中。
也许不久的将来,买到的专业卡将可以真正地加速三维创作的全系列工作——从三维建模一直到图像渲染(当然,时下也有一种方向是全部回归到软件——全部都靠CPU来执行)。
GPU渲染加速可能是CUDA目前最有前途的应用之一,其他领域上和CPU的争论仍在继续
CUDA(Compute Unified Device Architecture)是一个新的基础架构,这个架构可以使用GPU来解决商业、工业以及科学方面的复杂计算问题。它是一个完整的GPGPU解决方案,提供了硬件的直接访问接口,而不必像传统方式一样必须依赖图形API接口来实现GPU的访问。在架构上采用了一种全新的计算体系结构来使用GPU提供的硬件资源,从而给大规模的数据计算应用提供了一种比CPU更加强大的计算能力。CUDA采用C语言作为编程语言提供大量的高性能计算指令开发能力,使开发者能够在GPU的强大计算能力的基础上建立起一种效率更高的密集数据计算解决方案。
通过使用CUDA,图形工作站将可以充分地应用到Quadro显卡的强大计算能力。ATI也推出了一样性质的Stream Computing流计算技术。
专业卡因为面向的应用专业为名。事实上,并不是只有DCC数字内容创作才是专业应用——很多特别的应用都算专业的应用,这些应用你在普通的桌面游戏卡上无法实现,你只能寻求专业图形卡:
更精确的颜色:10-bit颜色通道
普通显卡使用的颜色通道都为8-bit,而现在的专业卡都可以达到10-bit,每RGB通道达到10-bit有什么好处呢?下图表示了不同位深的效果:1 bit、2 bit、4 bit以及8 bit图像的灰度级别,随着位深的增加,色彩梯度更加平滑,色阈也更加宽广。高位深表示在一个色阈中更多的采样数值,8 bit提供256个采样点,而10 bit提供1024个采样点,其色彩精度是8 bit 的4 倍。
按照RGB三原色计算,10 bit单色彩通道相加为30 bit色彩,或者说10亿色。
高精度:SDI接口
SDI(Serial Digital Interface,串行数字接口)是一种被广泛应用在专业视频编辑广播领域的接口。该接口的速度为270Mb/s,能够传输10bit精度,未经任何压缩的数字视频信号。是传输质量最高的数字视频接口之一。常用于连接非线性视频编辑系统和线性视频编辑系统,也有用SDI接口进行直接视频输出和录像。随着高清晰电视的来临,SDI接口也发展出了HD-SDI格式。NV的第十代Quadro在FX3800及其以上的型号中提供了HD SDI的支持。
更多的显示器:Quadro NVS 450可以提供4个DisplayPort接口
G-Sync:Frame lock和Genlock
Genlock(Generator Lock)其实就是提供该显卡刷新率信号的端口。在多个显卡/系统连接进行共同输出时(如视频墙、超高清晰度卫星地图显示)多个系统会因为行刷新率的不同导致画面出现闪烁或者条纹。GenLock接口则能够将显卡的内部刷新率型号告知其他系统的显卡,在共同进行连续视频输出时保持行刷新同步,避免这些情况的发生。
在进行集群渲染和可视化模拟时,每个显示系统所分到的任务量并不是一致的,复杂度的不同渲染时间自然也就不同,他们在进行共同输出时就会导致最终画面错误或者破碎。所以我们需要通过FrameLock接口来传输数据缓存同步信号和行刷新信号,以保证整个集群中所有系统最终显示速率的一致和渲染结果的正确。
专业卡市场目前主要有两个芯片厂商的产品:被AMD收购的ATI以及NVIDIA。其中ATI的专业卡以FirePro为名,其图形卡产品都以红色作为PCB颜色。而NVIDIA则是用Quadro的名称。目前,ATI和NVIDIA都提供了图形处理器通用计算技术,也能部分地提供GPU渲染加速功能。
最先出场的是ATI FirePro V5700,面向中端市场。FirePro V5700基于RV730图形核心,具备320个Shader处理单元,显存为512MB,支持DirectX 10.1、Shader Model 4.1、OpenGL 2.1、PCI-E 2.0、每RGB色彩通道8/10/16-bit HDR渲染、全30-bit显示管线、GPU通用计算、多屏显示等一系列特性和技术。
中端争霸 FirePro V5700对抗Quadro FX3800
正面由于散热器的覆盖,我们看不到具体的显存颗粒。而在显卡背面,我们看到了4颗显存(正面散热器下也有4颗)。
FirePro V5700显卡的GPU-Z截图
ATI FirePro V7750面向中高端市场,定位上比V5700要高一档。和V5700一样,ATI FirePro V7750基于RV730核心,具备320个流处理器,配备1GB显存,真30-bit显示管线,支持10-bit的RGB通道和HDR(High Dynamic Range,高动态光照渲染)配备Dual-link DVI以及双DisplayPort接口。
ATI FirePro V7750专业显卡,比V5700强大一些,也更长一些,不过仍然是单槽位设计
ATI FirePro V7750
ATI FirePro V8700面向高端专业市场——在V8750出现之前,V8700就是ATI规格不凡的专业卡,从规格上看,FirePro V8700源于在桌面上大获成功的RV770核心(对应的是Radeon HD4870显卡),拥有800个Shader处理单元和1GB的GDDR5显存,带宽为108.8GB/s。V8700的核心频率为750MHz,显存频率为1700MHz,支持DirectX 10.1、Shader Model 4.1、OpenGL 2.1、PCI-E 2.0、CrossFireX、每RGB色彩通道8/10/16-bit HDR渲染、全30-bit显示管线等一系列技术,配备两个DisplayPort和一个Dual-LinkDVI接口,最高分辨率 2560*1600,且支持高清色差输出和3D立体输出。
FirePro V8700显卡GPU-Z截图
NV的专业卡一直都以Quadro为名,相对来说,产品线要比FirePro更广一些,除了通常的Quadro FX桌面专业卡之外,还有移动/笔记本的Quadro Go、高端工作站用的Quadro Plex及图形服务器产品线。
Quadro FX380属于第10代Quadro产品。Quadro FX380作为入门级的产品,最吸引人的就是价格——它是Quadro 10中最便宜的型号。在NVIDIA官方的发布会上,Quadro FX380的价格被定为99美元,也是Quadro 10家族唯一一款100美元以下的产品。而在国内市场,这款产品目前的售价为1099元,也是一款千元级的产品。对于新款专业卡来说,这样的价格已经相当平易近人,甚至还不到一款高端娱乐卡的售价。
和上一代的Quadro FX370相比,Quadro FX380性能主要有几大改变。首先是显存位宽提升到了128bit,是原来Quadro FX370的一倍。其次是显存颗粒使用了更高规格的GDDR3,相比DDR2来说能够达到更高的频率,因此总带宽就是FX370的四倍,达到了22.4GB/s。FX380和FX370一样,具有16个流处理器和256MB显存容量。
和ATI不同,NVIDIA的中低端Quadro都不提供SLI功能
Quadro FX580面向中低端市场——比FX380高一个档次,它基于G98核心,具有32个流处理器,512MB显存,128bit显存位宽。
Quadro FX1800则面向中端市场,它具有64个流处理器,768MB显存,带宽为192bit。FX1800在某种程度上是FX580的增强版本,如Gsync/SDI这样的高级功能需要再上一级才会具备。
FX 1800使用了PCI-E 2.0 x16界面,最大59W的功耗让其仍然只需要单槽位设计
Quadro FX1800型号
两个DisplayPort接口和1个DualLink DVI-I接口
仍然不需要辅助电源接口。75W以上的PCIE显卡才需要额外的电源支持
GPU-Z
NVIDIA SLI Multi OS是一个全新的技术,首次实现了让两台虚拟机同时获得GPU加速能力。这项技术基于另一项虚拟技术的最新进展,即Intel的VT-d技术。新的VT-d技术能够重新映射DMA和设备的中断,甚至可以直接将中断分配给某一个操作系统,利用这个技术,NVIDIA实现了让一台物理机上的两个操作系统分别使用自己一块GPU,而且其性能与单操作系统的性能非常的接近。这是第一次在虚拟机上实现GPU的硬件加速。对于很多行业来说,这是非常重要的。例如在石油天然气行业,集团里常常会有很多的老的各种程序在运行,它们都是基于Linux的,而很多新的软件却是基于Windows来设计的。如果要同时运行两种软件的话,就必须使用两台独立的设备来进行,但现在可以通过使用虚拟机技术安装多个操作系统来解决这个问题,不单节省成本,也可以给工作带来很多便利。因为在一台机器上做数据共享比在两台机器上共享更加容易。
两块FX 3800——3800提供了SLI接口,不过这可能会误导群众,这里首先要说明的是:FX 3800支持SLI技术,但是SLI并不是一个能增强专业图形卡性能的技术——仅仅是一个用于游戏的多显卡技术。要想多Quadro联合渲染,你需要更高一个档次的FX 4800
FX3800只能支持SLI MultiOS,在通常的单系统平台下,多个FX3800只能用来接多个显示器,无法加快操作速度,而FX4800的SLI Frame Rendering则可以加速通常DCC类软件的预览渲染速度(要对最终的渲染加速,仍然需要使用NViRT功能——需要软件支持)
双Displayport和DVI输出接口设计,并提供一个立体眼镜输出
测试对比平台的详细参数如下:
专业卡测试平台、测试环境 | ||||
测试分组 | ||||
类别 | DELL Precision T5500工作站 双路Intel Gainestown Xeon X5550 | |||
处理器子系统 | ||||
处理器 | 双路Intel Xeon X5550 | |||
处理器架构 | Intel 45nm Nehalem | |||
处理器代号 | Gainestown | |||
处理器封装 | Socket 1366 LGA | |||
处理器规格 | 四核 | |||
处理器指令集 | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,SSE4.2,EM64T,VT | |||
主频 | 2.67GHz | |||
处理器外部总线 | 2x QPI 3200MHz 6.4GT/s 单向12.8GB/s(每QPI) 双向25.6GB/s(每QPI) | |||
L1 D-Cache | 4x 32KB 8路集合关联 | |||
L1 I-Cache | 4x 32KB 4路集合关联 | |||
L2 Cache | 4x 256KB 8路集合关联 | |||
L3 Cache | 8MB @ 2664MHz 16路集合关联 | |||
主板 | ||||
主板型号 | DELL Precision T5500 | |||
芯片组 | Intel Tylersburg-EP IOH:Intel 5520(Tylersburg-36D) ICH:Intel 82801JR(ICH10R) | |||
芯片特性 | 2x QPI VT-d Gen 2 | |||
内存控制器 | 每CPU集成三通道R-ECC DDR3 1066 | |||
内存 | 2GB R-ECC DDR3 1066 SDRAM x6 | |||
系统磁盘子系统 | ||||
磁盘控制器 | Intel ICH10R RAID Controller | |||
磁盘控制器规格 | 6x SATA 3Gb/s MatrixRAID 0/1/3/5 | |||
磁盘控制器设置 | SATA 3Gb/s AHCI w/NCQ | |||
磁盘控制器驱动 | Intel Matrix Storage Manager 8.8.0.1009 x64 | |||
磁盘 | Seagate Barracuda 7200.11 x1 | |||
磁盘规格 | 7200RPM 320GB SATA 3Gbps 16MB Cache | |||
磁盘设置 | SATA 3Gb/s NCQ 50GB系统分区 | |||
图形子系统 | ||||
显卡 | Misc | |||
显卡驱动 | Misc | |||
软件环境 | ||||
操作系统 | Microsoft Windows XP Professional x64 Edition SP2 |
专业卡测试平台
本次测试我们选择了常见的Windows XP Professional x64 Edition SP2操作系统作为平台。由于工作站通常配备较多的内存,因此使用64位操作系统比较合适,而由于一些SPEC测试套间尚未能很好地支持Vista系统,从软件兼容性来说,很明显Windows XP更适合我们的测试软件。常见的DCC类软件都已经有了Vista及64位的版本。
不过根据之前测试的结果,我们如果在同一台电脑中分别安装NVIDIA和AMD的显卡。即便是每次都卸载驱动,但难免会有AMD的驱动文件遗留在系统中,会对接下来的NVIDIA显卡测试造成性能影响。为此,我们本次测试使用了另外一块Seagate Barracuda 7200.11硬盘作为Quadro FX4800的系统盘。
为了体现专业显卡与普通显卡的区别,我们还特地加入了两块桌面游戏卡:GeForce GTX260+和Radeon HD4870,这两个都是比较超值的中高档游戏卡:
ATI Radeon HD4870显卡:RV770核心,800个统一着色器(和NVIDIA的流处理器不能直接比较),1GB显存,位宽256bit,核心频率750MHz,显存频率3.6GHz,符合Direct3D 10.1标准
NVIDIA GeForce GTX260+显卡:GT200核心,216个流处理器,864MB显存,位宽448bit,核心频率576MHz,显存频率2GHz,符合DirectX 10标准
桌面卡测试平台、测试环境 | |
测试分组 | |
类别 | 华硕P6T Deluxe V2 单路Intel Nehalem-WS Xeon W5580 |
处理器子系统 | |
处理器 | 单路Intel Xeon W5580 |
处理器架构 | Intel 45nm Nehalem |
处理器代号 | Nehalem-WS |
处理器封装 | Socket 1366 LGA |
处理器规格 | 四核 |
处理器指令集 | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,SSE4.2,EM64T,VT |
主频 | 3.2GHz |
处理器外部总线 | 2x QPI 3200MHz 6.4GT/s 单向12.8GB/s(每QPI) 双向25.6GB/s(每QPI) |
L1 D-Cache | 4x 32KB 8路集合关联 |
L1 I-Cache | 4x 32KB 4路集合关联 |
L2 Cache | 4x 256KB 8路集合关联 |
L3 Cache | 8MB @ 2664MHz 16路集合关联 |
主板 | |
主板型号 | 华硕P6T Deluxe V2 |
芯片组 | IOH:Intel X58 ICH:Intel 82801JR(ICH10R) |
芯片特性 | 1x QPI VT-d Gen 2 |
内存控制器 | 每CPU集成三通道R-ECC DDR3 1066 |
内存 | 2GB R-ECC DDR3 1066 SDRAM x3 |
系统磁盘子系统 | |
磁盘控制器 | Intel ICH10R RAID Controller |
磁盘控制器规格 | 6x SATA 3Gb/s MatrixRAID 0/1/3/5 |
磁盘控制器设置 | SATA 3Gb/s AHCI w/NCQ |
磁盘控制器驱动 | Intel Matrix Storage Manager 8.8.0.1009 x64 |
磁盘 | Seagate Barracuda 7200.11 |
磁盘规格 | 7200RPM 320GB SATA 3Gb/s NCQ 16MB Cache |
磁盘设置 | SATA 3Gb/s NCQ 50GB系统分区 |
软件环境 | |
操作系统 | Microsoft Windows XP Professional x64 Edition SP2 |
在测试桌面卡的时候,使用了另外搭建的平台:基于Nehalem-WS 2S Xeon W5580处理器的一个平台,主板是ASUS P6T Deluxe V2——因此这是一个单路的平台(虽然W5580支持双路处理),在单个处理核心上,比专业卡平台要更强劲(W5580的频率比专业卡平台的X5550更高),然而在总的处理能力上,显然是双路的X5550要更强一些。
根据被测显卡的情况,我们选择以下列表中的部分测试软件进行测试。
Cinbench R10
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。
SPECapc for Maya 6.5 v1.0
Alias Maya是一款功能强大的软件,集3D建模、动画和渲染等功能于一身,被广泛应用于电影、电视、游戏开发、视觉设计等领域。SPECapc for Maya 6.5测试包括5个部分,总共采用了4种模型(狼人、手、蚂蚁和鱿鱼),分别测试了wireframe、Gouraud-shaded、texture、 texture highlighted with a wireframe mesh、texture with wireframe mesh and control points模式下的性能。SPECapc for Maya 6.5相对于上一代的测试软件的最大改进是用glDrawElements取代了glArrayElement,具有更高的效率。Maya使用OpenGL API。
SPECapc for 3ds Max 9
SPECapc for 3ds Max 9是基于典型用户的使用情况设定的负载,在测试过程中会涉及到wireframe modeling、shading、texturing、lighting、blending、inverse kinematics、object creation and manipulation、editing、scene creation、particle tracing、animation 和 rendering。3ds Max 8开始同时支持OpenGL和DirectX 8.0/9.0 API。
SPECapc for SolidWorks 2007
SPECapc for SolidWorks 2007是由SolidWorks开发的,用于帮助SolidWorks 2007用户快速评估自己的工作站系统的一个工具。它由VB和C语言编写而成,可运行在Windows XP 32/64bi操作系统上。测试过程中使用了大小不一的CAD/CAM solid模型,最大的模型是一个由313万个顶点组成的引擎。SolidWorks使用OpenGL API。
SPECviewperf 9
SPECViewperf 9.0是SPEC推出的专业级、符合工业标准的OpenGL 图形显示卡效能测试分析软件的第9个版本,其测试项目有六项:3dsmax、DRV、DX、Light、ProE、Ugs,包括软件执行效能仿真(3dsmax、 ProE)、以及动画公园场景仿真(Light)..等等,可以产出相关的分析数据。SPECviewperf 9使用OpenGL API。
SPECviewperf 10
SPECviewperf 10是SPECviewperf的第10个版本,和上一个版本相比,测试项目更加复杂完善。SPECviewperf 10可以告知你在多少倍抗锯齿下显卡性能表现会低于无抗锯齿情况下的10%,并提供截图比较。SPECviewperf 10仍然使用OpenGL API。
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。
CineBench R10:OpenGL性能
在服务器测试中,我们使用CineBench测试处理器的性能。而在工作站中,CineBench还提供了显卡性能的参考数据。从结果来看,定位略高的FirePro表现略好于Quadro。令人惊奇的是HD4870和GTX260+的表现也不错——CineBench的测试比较短而简单,专业卡的稳定性和全面性都无法体现出来。
Alias Maya是一款功能强大的软件,集3D建模、动画和渲染等功能于一身,被广泛应用于电影、电视、游戏开发、视觉设计等领域。SPECapc for Maya 6.5测试包括5个部分,总共采用了4种模型(狼人、手、蚂蚁和鱿鱼),分别测试了wireframe、Gouraud-shaded、texture、 texture highlighted with a wireframe mesh、texture with wireframe mesh and control points模式下的性能。SPECapc for Maya 6.5相对于上一代的测试软件的最大改进是用glDrawElements取代了glArrayElement,具有更高的效率。Maya使用OpenGL API。最近SPECapc for Maya推出了for 2009的版本。
SPECapc for Maya 6.5:Overall
从总分来看,FirePro的表现都很好,比Quadro高不少。不过Quadro系列的得分都很一致。
SPECapc for Maya 6.5:GFX
FirePro的性能在Maya上表现良好。
SPECapc for Maya 6.5:CPU
相同的CPU的结果也很相似。
SPECapc for Maya 6.5:I/O
I/O项目上Quadro平台要好不少。
SPECapc for 3ds Max 9是基于典型用户的使用情况设定的负载,在测试过程中会涉及到wireframe modeling、shading、texturing、lighting、blending、inverse kinematics、object creation and manipulation、editing、scene creation、particle tracing、animation 和 rendering。3ds Max 8开始同时支持OpenGL和DirectX 8.0/9.0 API。
SPECapc for 3ds Max 9:Software
Software模式也就是软件渲染,不过显卡多多少少也有一点影响,总的来说相同档次的显卡相差不是很大……
SPECapc for 3ds Max 9:OpenGL
早些年OpenGL一直是NVIDIA的强项,不过这个情况在近年得到了改变:FirePro V8700表现很强劲,当然它的定位要比FX4800要高一些。最近的驱动中ATI和NVIDIA都提供了OpenGL 3.0的支持。
SPECapc for 3ds Max 9:Direct3D
ATI系列显卡硬件支持到Direct3D 10.1,而NVIDIA系列支持到Direct3D 10,从性能上看,情况和OpenGL下一样。
SPECapc for SolidWorks 2007是由SolidWorks开发的,用于帮助SolidWorks 2007用户快速评估自己的工作站系统的一个工具。它由VB和C语言编写而成,可运行在Windows XP 32/64bi操作系统上。测试过程中使用了大小不一的CAD/CAM solid模型,最大的模型是一个由313万个顶点组成的引擎。SolidWorks使用OpenGL API。
SPECapc for SolidWork 2007
SPECapc for SolidWork 2007
FX4800的耗时是131.24秒,而档次略高的V8700则是137.59,因此Quadro的表现显得要好一些。
SPECViewperf 9.0是SPEC推出的专业级、符合工业标准的OpenGL 图形显示卡效能测试分析软件的第9个版本,其测试项目有六项:3dsmax、DRV、DX、Light、ProE、Ugs,包括软件执行效能仿真(3dsmax、 ProE)、以及动画公园场景仿真(Light)..等等,可以产出相关的分析数据。SPECviewperf 9使用OpenGL API。
SPECviewperf 9.0的测试项目比较多,包括3dsmax-04、catia-02、ensigh-03、light-08、maya-02、proe-04、sw-01、tcvis-01、ugnx-01:
SPECviewperf 9.0:3dsmax-04
测试得分比较详尽,FirePro表现略好。
SPECviewperf 9.0:catia-02
catia-02项目则是Quadro表现比较好。
SPECviewperf 9.0:ensight-03
ensight-03表现大致差不多
SPECviewperf 9.0:light-08
SPECviewperf 9.0:maya-02
SPECviewperf 9.0:proe-04
proe-04上,Quadro系列要高出20%以上。
SPECviewperf 9.0:sw-01
SPECviewperf 9.0:tcvis-01
SPECviewperf 9.0:ugnx-01
ugnx-01项目FirePro成绩惊人,明显比Quadro高出不少,最低的V5700都比FX4800要高。
SPECviewperf 10是SPECviewperf的第10个版本,和上一个版本相比,测试项目更加复杂完善。SPECviewperf 10可以告知你在多少倍抗锯齿下显卡性能表现会低于无抗锯齿情况下的10%,并提供截图比较。SPECviewperf 10仍然使用OpenGL API。
SPECviewperf 10包括6个测试项目,它们输出结果恰好按照字母排列:3dsmax-04、catia-02、ensight-03、maya-02、proe-04、sw-01、tcvis-01、ugnx-01,此外,SPECviewperf 10测试还分别测试了在各种AA抗锯齿条件下的性能以及在多线程操作下的性能,因此导致输出结果比较多。在测试中,NVIDIA系列显卡可以支持到32x AA,而ATI系列只能达到8x,因此对比结果上只提供了8x的情况:
3dsmax-04:基本测试
专业卡全面领先于娱乐卡一倍以上。
3dsmax-04:8x AA
尽管ATI无法达到8x以上的AA,不过,在8x AA的情况下,ATI FirePro系列显卡的性能下降比较少,而NVIDIA Quadro则比较明显,优异的FX4800从49.34下降到43.01,而最入门的FX370LP则从44.54下降至24.64。AA是一个极耗显存容量和显存带宽的选项,因此显卡的显存配置比较重要(入门级别的FX370LP只有128bit宽度的256MB显存)。
3dsmax-04:4线程综合
在多线程的状态下,所有显卡的性能都有所提升,不过,幅度并不相同,高端的Quadro FX4800、FX3800、FX1800和FirePro V5700、V7750、V8700性能明显要比低端的FX580和FX380高出一大截。可以说,ATI的低端显卡表现比较好一点。
catia-02:基本测试
在3dsmax-04测试上,Quadro和FirePro的性能大致相似,而在catia-02测试上,Quadro要全面胜出。
catia-02:8x AA
和3dsmax-04项目相似,在AA条件下,显存不足的显卡性能下降较大。
catia-02:4线程综合
在多线程状态下,FirePro发挥的更好。
ensight-03:基本测试
maya-02:基本测试
maya-02测试,性能大致和其定位一致。
maya-02:8x AA
FirePro V8700表现一直独秀……由于显存配置比较低,FX380和FX580表现和桌面卡差不多。现代的中端桌面卡都拥有512MB以上的显存容量和巨大的显存带宽。
maya-02:4线程综合
FirePro V8700的表现仍然是非常突出。
proe-04:基本测试
在proe-04项目上,Quadro军团的表现明显比FirePro要好。
proe-04:8x AA
proe-04:4线程综合
FirePro V5700的定位比Quadro FX380的定位要高一点,性能则比较相似。
sw-01:基本测试
sw-01测试也是Quadro表现比较突出。
sw-01:8x AA
可以发现,FirePro V8700和V7750的性能几乎就和无AA的时候一样——包括HD4870。
sw-01:4线程综合
tcvis-01:基本测试
通常状态下,Quadro的表现好一些。
tcvis-01:8x AA
AA下则是FirePro好一些。
tcvis-01:4线程综合
ugnx-01:基本测试
ugnx-01:8x AA
在ugnx-01上,FirePro系列显卡具有明显的优势。
【IT168评测中心】现代的专业图形卡发展迅速——整个图形卡市场都是这样。到目前为止,GPU的计算性能增长已经超过了所用的CPU的计算性能增长,雄心勃勃的图形芯片厂商还企图通过GPGPU让显卡担当更多的计算任务,在高性能计算市场,硝烟已起。
在传统的专业卡应用上,虽然专业卡基本上仍然是通过加速DCC类软件的预览渲染来加速专业创作的效率,最终渲染多是依靠CPU。不过这个情况近来也有所改变,尽管应用比较难,通过HLSL/GLSL语言也可以实现一些CPU渲染上用到的Ray Trace效果。NVIDIA的第十代更是通过自身的CUDA实现了NViRT(NVIDIA Interactive Ray Tracing),专业卡未来的目标就是成为不需要CPU的真正图形加速卡。在Direct3D 11里面增加的Compute Shader有望成就这个目标(此外,还有负责OpenGL开放标准的行业组织Khronos Group宣布的OpenCL)。
在我们的测试当中,可以看到,NVIDIA的Quadro具有不凡的威力。确实,在过去10年里,NVIDIA一直在开拓专业图形市场,无论是产品线的宽度上,还是产品的性能上,都比老对手显得要强。例如,在入门级别的产品上,Quadro的选择要更方便一些,需要专业应用而又囊中羞涩的可以选择FX380这样的便宜专业显卡,提供了专业卡所需要的各种要素:稳定性、兼容性以及专业图形驱动,也能提供比较不错的性能。
ATI FirePro V8700,Direct3D 10.1硬件支持
测试中,如Maya、3ds Max这样的应用中ATI FirePro表现不错,这些应用环境下你应该选择ATI FirePro。此外,其抗锯齿选项对性能的影响也很小——硬件支持Direct3D 10.1对抗锯齿有性能提升的效果,虽然大部分应用都是OpenGL,然而硬件层级的支持仍然能发挥一定作用。NVIDIA的Quadro则如SolidWorks这样的应用优势明显,并且具有更强的整体性能,除了Maya、3ds Max这样的应用,用户都可以选择Quadro。
在一些项目中,娱乐卡——GeForce GTX275和ATI Radeon HD4870也能有不错的效果,如Maya这样的应用,不过,大部分情况下娱乐卡的性能都很低,它们没有为专业应用作优化的专业显卡驱动,难保不会出现兼容性问题,并且稳定性也难有保障,因此最好还是选择专业显卡。
中端争霸 FirePro V5700对抗Quadro FX3800
(完)