【IT168评测中心】北京时间2009年3月26日,NIVIDIA正式发布了自家Quadro FX系列专业显卡的新产品,分别是Quadro FX 580/1800/3800,这三款产品均定位于中端市场,全部都配备了两个DisplayPort和一个Dual-Link DVI接口。这三款显卡均基于G92核心架构,隶属于NVIDIA的第十代Quadro FX产品线,对于NVIDIA中端专业卡市场来说形成了有益的补充。我们有幸在早些时候拿到了本次发布的Quadro FX1800显卡,并且在之前的文章中透露了一些测试结果(详情见:六块显卡互联 华硕Nehalem主板全国首测)。
就我们本次测试的Quadro FX1800显卡来说,作为之前Quadro FX1700的替代产品,它的定位依然是中端市场,主要销售方向是注重性价比的用户。不过相比Quadro FX1700来说,Quadro FX1800增加了许多新的特征:
从规格表来看,Quadro FX1800相比前一代产品有了长足的进步,在硬件和软件规格上都进行了较大的成绩,增加了显存容量和位宽,同时在支持的软件上也有所改进,能够支持OpenGl 3.0规范。虽然规格在提升,不过它所标称的功耗却比之前下降了5W,接口部分也更适合目前主流的需要。可以说,Quadro FX1800是一款中端领域的全新产品。不过具体的性能如何,我们还是一起来看看。
Quadro 10周年:自1999年NVIDIA推出Quadro品牌以来,到现在已经跨过了9个年头,迎来了十周年的纪念日,这十周年里,Quadro带来了第一个硬件T&L,第一个实时渲染动画(最终幻想)、第一个GPU HD SDI/NVSG解决方案、第一个可扩展GPU图形解决方案QuadroPlex、CUDA HPC解决方案等许许多多个解决方案,那么,Quadro的十周年会给我们带来什么呢?
1999-2000年 ——Quadro于1999年问世,当时正值Unix/RISC平台真正开始向基于Windows/Intel的工作站过渡之际,那是一段很有意思的时期。当时,一块Quadro显卡基本上具备了一台工作站所需要的特性:坐标转换和照明的硬件处理以及硬件线框加速。
第一个基于Quadro的移动工作站发布。
2001-2002年 ——开发人员开始利用Quadro GPU(图形处理器)的主要功能,将Cg语言着色器整合到他们的应用程序中。
提供IA64 Quadro驱动。
2003-2004年 ——工作重点从开发图形加速器转到开发解决方案上来,例如用于广播的“图形处理到视频输出”(Graphics to Video Out)。 这段时期,GPU(图形处理器)蓬勃发展,出现了各种卡型的产品,例如刀片服务器(Blade)。
GPU HD SDI/NVSG 1.0出现。GPU Gsync出现。
2005-2006年 ——随着64位Linux与Windows的推出,可扩展性得到了更多的关注。首款可扩展图形系统QuadroPlex出现了。
2007-2008年 ——GPGPU(通用图形处理器)计算的兴起让广大开发人员看到了GPU并行架构的强大能力,CUDA应运而生。CUDA是一种C编程语言,它让开发人员能够将其所开发的应用程序从由CPU处理转变为由GPU处理,从而大大提升了性能。
实时HD-SDI,交错GPU光线追踪。透明的GPU显示转换器。4GB GPU显存。
Quadro 10周年:在Quadro推出的第十个年头,NVIDIA将会提供四个创新的功能,它们分别从伸缩性(NVSCALE)、真实化(NVIRT)、虚拟实景(3D Vision Pro)、计算机视频(SDI Input Card)四个方面来给用户带来更多的功能和体验。
NVSCALE
我们再来看看除了虚拟化以外,Quadro带来的新应用与新技术。首先是Scale应用下NVSCALE,这主要是指新的Quadro在多GPU工作即SLI时有了改进。也许大家并不清楚,目前的所有SLI,都只能使用到主卡的显存即一块卡的显存。而新的NVSCALE将允许Quadro SLI使用所有显卡的显存,应用于大型渲染。
NVIRT
NVIRT是目前惟一可以投入开发的光线追踪技术,它通过CUDA来实现3D渲染,与目前我们看到的3D应用不同,它基于光线追踪技术而非光栅化技术。NVIRT在2008年末有相关一个赛车场景渲染成品展示,这也是目前惟一公开展示,且流畅运行的实时光线追踪DEMO。
3D Vision Pro
3D Vision Pro,是前不久NVIDIA发布的3D Vision的专业版。与普通版本相比,它的无线传输方式将从红外改为射频,允许多个眼镜同时使用,而且使用者也可以更加随意走动,信号覆盖范围更广(但3D效果和使用者距离有关,还是不能太随意)。
SDI Input Card
对于实时多路视频图像采集分析以及再处理应用中,SDI Input Card负责采集工作,而与之配套的应用将可以利用CUDA发挥更强大的性能。
每年推出Quadro新品的时候,NVIDIA总会提供整个系列的产品线,包含了最入门的应用到最高端的产品,价格幅度也从$99一直到$3299。我们手上的Quadro FX 1800属于Mid-Range——中端产品,价格为$149。
和两位数的入门产品相比,FX 1800具有适中的CUDA并行处理器数量(64个),以及较可观的显存容量(768MB),显存位宽也达到了192-bit(入门产品是128-bit),目的在于提供比入门产品更强大的功能。
作为中端产品,如SLI、SDI等高级功能就没有提供,不过,FX 1800具有Quadro中的精髓部分:CUDA GPU计算功能。
CUDA(Compute Unified Device Architecture)是一个新的基础架构,这个架构可以使用GPU来解决商业、工业以及科学方面的复杂计算问题。它是一个完整的GPGPU解决方案,提供了硬件的直接访问接口,而不必像传统方式一样必须依赖图形API接口来实现GPU的访问。在架构上采用了一种全新的计算体系结构来使用GPU提供的硬件资源,从而给大规模的数据计算应用提供了一种比CPU更加强大的计算能力。CUDA采用C语言作为编程语言提供大量的高性能计算指令开发能力,使开发者能够在GPU的强大计算能力的基础上建立起一种效率更高的密集数据计算解决方案。
通过使用CUDA,图形工作站将可以充分地应用到Quadro显卡的强大计算能力。
Quadro FX 1800属于第十代Quadro的中端产品
64个GPU,192-bit 768MB GDDR3显存,带宽达到了38.4GB/s,FX 1800提供了30位色输出(10位像素),FX 1800不支持SDI和SLI。
FX 1800使用了PCI-E 2.0 x16界面,最大59W的功耗让其只需要单槽位设计,FX 1800还提供了新世代的输出方式:两个DisplayPort接口和1个DualLink DVI-I接口,DisplayPort与通常的DVI、HDMI接口相比都具有独特的优势。
DisplayPort接口(左)与HDMI接口(右)都非常小巧
从尺寸上看,与DVI和D-Sub相比,HDMI与DisplayPort无疑都非常小巧,对于在各种设备上的应用来说,拥有极高的便利性。和HDMI一样,DisplayPort也允许音频与视频信号共用一条线缆传输,支持多种高质量数字音频。但DisplayPort一条线缆上还可实现更多的功能,它目前提供了10.8Gb/s的带宽,日后将会发展至21.6Gb/s(而HDMI 1.3所提供的带宽为10.2Gb/s),极高的带宽让DisplayPort可以轻松支持极大的分辨率:WQXGA+(2560×1600)及以上,同时还能支持30/36bit(每原色10/12bit)的色深。
此外,DisplayPort还可以直接驱动面板进行显示,不需要再通过会降低响应时间的LVDS转换电路,最后也是最重要的一点:DisplayPort还是一个完全开放授权的技术,使用上完全免费。
Quadro FX1800的造型没有FX1700那么开放,而是使用了一体化的散热,显卡的散热器放在了核心右侧。由于包裹得太严密,在外壳正面我们只能看到NVIDIA Quadro的字样,而右上角的Quadro FX1800说明了它的型号。
好不容易拆掉了外壳的导风罩(5颗螺丝),我们看到Quadro FX1800的内部构造较为简单。显卡的大面积区域被散热片覆盖。
测试平台、测试环境 | ||||||||
测试分组 | ||||||||
类别 | Quadro FX1800平台 | HP xw8600 Workstation | ||||||
处理器子系统 | ||||||||
处理器 | Intel Nehalem-EP E5540 | 双路Intel Xeon E5430 | ||||||
处理器代号 | Gainestown | Harpertown | ||||||
处理器封装 | Socket 1366 LGA | Socke 771 LGA | ||||||
处理器规格 | 四核超线程 内置内存控制器 | 四核 | ||||||
处理器指令集 | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,SSE4.2,EM64T,VT | MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,EM64T,VT | ||||||
主频 | 2.53GHz | 2.66GHz | ||||||
处理器外部总线 | QPI Link:2933MHz | FSB:1333MHz | ||||||
L1 D-Cache | 4x 32KB 8路集合关联 | 4x 32KB 8路集合关联 | ||||||
L1 I-Cache | 4x 32KB 4路集合关联 | 4x 32KB 8路集合关联 | ||||||
L2 Cache | 4x 256KB 8路集合关联 | 2x 6MB 24路集合关联 | ||||||
L3 Cache | 8MB 16路集合关联 | - | ||||||
主板 | ||||||||
主板型号 | 华硕P6T6 WS Revolution | HP | ||||||
北桥芯片组(MCH) | Intel X58 | Intel 5400 | ||||||
北桥芯片特性 | Intel VT-d技术 | 24MB Snoop Filter | ||||||
内存控制器 | 处理器内置三通道DDR3 | 北桥集成四通道FB-DDR2 | ||||||
内存 | 1GB DDR3 1066 SDRAM x3 | 2GB FB-DDR2 667 SDRAM x4 | ||||||
系统磁盘子系统 | ||||||||
磁盘控制器 | LSI SAS 3041E-R | LSI SAS1068E Controller | ||||||
磁盘控制器规格 | SATA 3Gbps x4 | SAS 3Gbps x8 | ||||||
磁盘控制器设置 | RAID 0 | HostRAID 0 | ||||||
磁盘控制器驱动 | LSI SAS 1.28.03.00 | LSI?SAS 2.23.0.64 | ||||||
磁盘 | Seagate Cheetah 15K.5 ST314655SS 146GB 16MB SAS x2 | Fujitsu MBA3300RC x2 | ||||||
磁盘规格 | 15000RPM 146GB SAS 3Gbps 16MB Cache | 15000RPM | ||||||
磁盘设置 | SATA 3Gbps 50GB系统分区 | SAS 3Gbps 50GB系统分区 | ||||||
图形子系统 | ||||||||
NVIDIA Quadro FX 1800 | NVIDIA Quadro FX 4600 | |||||||
显卡参数 | 768MB RAM | 768MB RAM | ||||||
显卡驱动 | NVIDIA Quadro 182.46 WHQL for Windows XP | NVIDIA Quadro 181.20 WHQL for Vista64 | ||||||
软件环境 | ||||||||
Microsoft Windows XP SP3 32Bit | Microsoft Windows Vista Ultimate x64 SP1 |
我们使用华硕P6T6 WS Revolution主板搭建了一套中端工作站平台。处理器方面,我们选择了使用Nehalem-EP核心的至强E5540。这款处理器是目前Nehalem-EP产品线中的主流产品,也是Intel英特尔刚刚发布的处理器,性能强大。硬盘方面,我们选择了希捷Seagate Cheetah 15K.5硬盘,转速为15000rpm,使用两块组成RAID 0阵列,获得更好的性能。测试中,我们并没有使用P6T6 WS Revolution主板自带的阵列芯片,而是采用了LSI SAS 3041E-R卡,它是一款4端口3Gbps SAS卡,集成RAID 0、RAID 1、RAID 1E和10E功能,用在这里绰绰有余。
值得一提的是,为了便于大家观察Quadro FX1800的性能提升,我们选择了惠普xw8600工作站进行对比,这款工作站使用了Quadro FX4600显卡,是Quadro产品线偏高端的产品,NVIDIA对它的描述是“卓越图像品质”。不过由于测试平台存在着较大差异,我们这里提供的对比数据仅供参考。
虽然华硕P6T6 WS Revolution主板号称是Nehalem-EP工作站,但是在CPU-Z软件中,它明显还不能够识别最新的至强E5540处理器,但是却清晰的标出了ES的字样。
这里,我们使用的显卡驱动版本与之前略微有所不同。在华硕P6T6 WS Revolution主板的测试文章中,我们使用的是181.48版驱动,这是一款Beta版的驱动。而本次,我们使用了NVIDIA官方发布的182.46版驱动,稳定性和兼容性均有所提升。
根据被测显卡的情况,我们选择以下列表中的部分测试软件进行测试
Cinbench R10
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。
POV-Ray 3.6
POV-Ray是由名为Persistence OF Vision Devlopmentteam的开发小组在DKBTrace2.12的基础上编写而成的一个场景渲染软件。它为了减少了编制算法程序的时间而使用专用的场景描述语言来绘制三维场景。POV-Ray同时支持32位和64位,提供了Windows、Linux等多个平台下的运行版本。
SPECapc for SolidWorks 2007
SPECapc for SolidWorks 2007是由SolidWorks开发的,用于帮助SolidWorks 2007用户快速评估自己的工作站系统的一个工具。它由VB和C语言编写而成,可运行在Windows XP 32/64bi操作系统上。测试过程中使用了大小不一的CAD/CAM solid模型,最大的模型是一个由313万个顶点组成的引擎。
SPECviewperf 9
SPECViewperf 9.0是是专业级、符合工业标准的 OpenGL 图形显示卡效能测试分析软件,其测试项目有六项:3dsmax、DRV、DX、Light、ProE、Ugs,包括软件执行效能仿真(3dsmax、ProE)、以及动画公园场景仿真(Light)..等等,可以产出相关的分析数据。
SPECviewperf 10
SPECviewperf 10是一款测试专业显卡在多个CAD/DCC应用程序中的OpenGL性能的软件,包括3ds max、CATIA、EnSight、Maya、Pro/ENGINEER、SolidWorks等。最新推出的SPECviewperf 10可以告知你在多少倍抗锯齿下显卡性能表现会低于无抗锯齿情况下的10%,并提供截图比较。
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。
CineBench R10 32bit | ||
处理器 | 至强E5540 | 至强E5430 |
显卡 | Quadro FX1800 | Quadro FX 4600 |
CPU Benchmark | ||
Rendering (1 CPU) | 3224 | 2907 |
Rendering (x CPU) | 13168 | 16936 |
Multiprocessor Speedup | 4.06x | 5.83x |
OpenGL Benchmark | ||
OpenGL Standard | 6718 | 4824 |
我们首先使用的测试软件为CineBench R10。从测试结果来看,单处理器情况下,至强E5540的成绩要比对比平台高出10%,而在多处理器的测试中,惠普xw8600工作站使用的是双路平台,而至强E5540只有通过SMT功能虚拟出来的处理器。虽然处理器的数量相同,但事实证明实实在在的处理器要比虚拟的处理器性能更强(这样的结果也在情理之中)。
而关乎显卡的OpenGl测试中,Quadro FX1800的得分达到了6718,Quadro FX4600的成绩只有4824,差距较为明显。
POV-Ray是由名为Persistence OF Vision Devlopmentteam的开发小组在DKBTrace2.12的基础上编写而成的一个场景渲染软件。它为了减少了编制算法程序的时间而使用专用的场景描述语言来绘制三维场景。POV-Ray同时支持32位和64位,提供了Windows、Linux等多个平台下的运行版本。最新的稳定版是3.6。
POV-Ray | |||
1280*1024 no AA | 1280*1024 no AA | ||
显卡 | Quadro FX 1800 | Quadro FX 4600 | |
CPU Time Used(数据越小越好) | |||
Kernel(Second) | 0.28 | 0.37 | |
User(Second) | 786.30 | 877.71 | |
Total(Second) | 786.58 | 878.08 | |
Render Benchmark(越大越好) | |||
PPS(Pixel per Second) | 187.47 | 167.93 |
我们在1280*1024分辨率下应用POV-Ray软件进行了测试。从结果来看,Quadro FX1800的成绩全面领先,在Kernel、User和Total三项中的耗时明显低于Quadro FX4600。而在最终的PPS(秒像素)得分上,Quadro FX1800的成绩优于Quadro FX4600很多,性能差距在10%以上。
SPECapc for SolidWorks 2007是由SolidWorks开发的,用于帮助SolidWorks 2007用户快速评估自己的工作站系统的一个工具。它由VB和C语言编写而成,可运行在Windows XP 32/64bi操作系统上。测试过程中使用了大小不一的CAD/CAM solid模型,最大的模型是一个由313万个顶点组成的引擎。
Quadro FX1800得分
Quadro FX4600得分
SPEC的参考系统的处理器主频为2.4 GHz Intel Xeon处理器、2GB of PC800 ECC RAMBUS内存、NVIDIA Quadro FX 1000显卡、40GB ATA IV/100硬盘和Windows XP SP2操作系统。每项测试之后都能得到一个完成该项目的时间,通过把这个时间同参考系统完成同样的项目的时间进行比对,即可得到Ratio得分,该得分是越高越好。
在Ratio的结果部分,我们看到,Quadro FX1800的得分大面积领先,只有在Small Case项目中有略微落后。整体来看,在这个项目的测试中Quadro FX1800表现依然不错,除显卡项目之外,在处理器和磁盘项目中也处于领先。
SPECViewperf 9.0是是专业级、符合工业标准的 OpenGL 图形显示卡效能测试分析软件,其测试项目有六项:3dsmax、DRV、DX、Light、ProE、Ugs,包括软件执行效能仿真(3dsmax、ProE)、以及动画公园场景仿真(Light)..等等,可以产出相关的分析数据。
在SPECviewperf 9测试中,proe-04测试对于系统内存容量有着比较高的要求,Maya-02代表的是Maya 6.5的运行情况,对系统造成了很高的负载。tcvis-01和ugnx-01在SPECviewperf9之前的版本中未曾出现过,属于增加的测试,其中tcvis-01基于Teamcenter Visualization Mockup软件,ugnx-01基于UGS的NX3软件。
从测试结果来看,Quadro FX1800的表现还不错,多个项目中的成绩都达到了40分以上。
SPECviewperf 10是一款测试专业显卡在多个CAD/DCC应用程序中的OpenGL性能的软件,包括3ds max、CATIA、EnSight、Maya、Pro/ENGINEER、SolidWorks等。最新推出的SPECviewperf 10可以告知你在多少倍抗锯齿下显卡性能表现会低于无抗锯齿情况下的10%,并提供截图比较。
3dsmax-04测试结果
3ds max Viewset 测试是摸拟显卡在运行3ds max 3.1的轨迹渲染,为了确保一个可对比性,Discreet的OpenGL外持驱动会在轨迹渲染时使用。
Viewset 基于一条运行的轨道,其模型来自于3dsmax 3.1测试包,第一个模型会被用于测试两种极有可能被3dsmax用户大量用到的光源。高复杂性模型使用5-7个不同位置的光源,而中等复杂性的模型采用两个不同位置的光源。
catia-02测试结果
CATIA Viewset测试是摸拟显卡在运行CATIA V5R12的轨迹渲染,测试的三个模型是直接采用CATIA中的模型,LionHeart Solutions的Phil Harris,CATBench2003的开发员,提供了该模型进行测试。这辆汽车模型包含了超过两百万个顶点,SPECviewperf使用了一个更加复杂化的线框模型将其中的汽车引擎部分取代,这个模型包含了120万个顶点(引擎部分),180万个顶点(底部)
当画面或观察角度改变时,所有的渲染工作包括了模型渲染,矩阵运算,材质,光线等等,所有的运算过程对于显卡是一项要当大的压力。
ensight-03测试结果
EnSight Viewset代替了之前版本中的Data Explorer Viewset,其主要的测试范围是以引擎与科学动算有关,采用了来自于CEI的EnSight引擎与软件。
CEI提供了这个适合于测试所用的模型与工作量,大量的EnSight模型都通过OpenGL API使用到了列表显示与直接模型通道。而这个模型的数据,也被SPECViewperf 8.0中采用的每帧320万的顶点数据所取替。
当画面或观察角度改变时,所有的渲染工作包括了模型渲染,矩阵运算,材质,光线等等,所有的运算过程要比早前版本中单一简单的多边形模型要复杂许多。
maya-02测试结果
Maya Viewset测试是用于摸拟显卡在运行Alias公司的Maya V5时的渲染与工作量。测试所采用的模型与脚本均由NVIDIA公司提供,当画面或观察角度改变时所有的渲染工作包括了模型渲染,矩阵运算,材质,光线等等,所有的运算过程要比早前版本中单一简单的多边形模型要复杂许多。
proe-04测试结果
Pro/ENGINEER Viewset测试是用于摸拟显卡在运行PTC公司的Pro/ENGINEER 2001时的渲染与工作量,有两个主要的模型与三个渲染模型会在测试中运行,第一个模型,PTC World Car包含了一个介于390-590万顶点的工作量。这个模型测试是还包括了Shader工作,隐含线性移除,线框构建等。其中线框工作量的测试会基于正常与线性抗失真的模式。第二个模型是一个复制品,一个中等大小的模型由48.5万至160个顶点组成,SHader与隐含线性框移除同样在该模型中会被测试到PTC World Car Shader每一帧包启了超过100MB的顶点信息与状态。
sw-01测试结果
SolidWorks Viewset测试是用于摸拟显卡在运行Dassault System公司的Solidworks2004软件,当画面状态或观察角度改变时所有的渲染工作包括了模型渲染,矩阵运算,材质,光线等等,所有的运算过程要比早前版本中单一简单的多边形模型同样要复杂许多。
tcvis-01测试结果
tcvis-01 viewset测试是以UGS推出的Teamcenter Visualization Mockup软件为基础。测试包会按照规定对全部模型执行一定的运算,包括:矩阵、材质、光线的变化,所有动作均为电脑自动执行。所有变化相比老一代的viewsets测试均会为显卡系统造成更大的负载。
ugnx-01测试结果
ugnx-01 viewset测试是基于UGS的NX3软件为基础,主要表现非常巨大的模型,一些模型数据大小甚至能够达到800MB。新的测试包基于汽车工业,由UGS和SPEC/GPC合作完成。测试包会按照规定对全部模型执行一定的运算,包括:矩阵、材质、光线的变化,所有动作均为电脑自动执行。所有变化相比老一代的viewsets测试均会为显卡系统造成更大的负载。
从测试项目来看,我们发现相比刚刚进行的SPECviewperf 9来说,SPECviewperf 10的测试项目并没有改变,相应的测试结果也和SPECviewperf 9相近,虽然在具体的得分上互有胜负,但是总体的趋势保持一致。
【IT168评测中心】作为NVIDIA第十代Quadro FX家族成员,Quadro FX1800替代之前的FX1700成为了当前中端市场的主力产品。从上表中我们可以看到,NVIDIA将Quadro FX1800规划成了十代产品中唯一一款中端显卡,与下面的Quadro FX580、Quadro FX380和高端的Quadro FX3800、Quadro FX4800相呼应,599美元的售价也使得它更加亲民。
在测试中,我们尝试在一些项目中将Quadro FX1800与我们之前测试过的Quadro FX4600进行对比。从测试的结果来看,Quadro FX1800在部分项目中已经超过了Quadro FX4600的性能表现,而且一些项目的领先优势非常明显。结合599美元的售价,我们认为Quadro FX1800是一款具备很高性价比的专业卡,比较适合入门级设计人员使用。