服务器 频道

基于曙光5000的渲染农场解决方案

    【IT168 案例】渲染是数字创意和动漫制作等领域一个不可缺少的制作环节,渲染农场的诞生更好地解决了制作中对时间、制作精度等各面的更高要求。本文通过分析渲染农场的应用特点,并结合目前刚刚推出的曙光5000产品,介绍了基于曙光5000的渲染农场解决方案。曙光5000系统不但可以更高地提升渲染农场的整体性能,与此同时从易管理和低价格方面更是贴近用户。

    1. 什么是渲染农场?

    在三维动漫、影视制作、建筑设计等等与图形设计有关的数字创意和制作领域中,渲染(Render)是所有设计中所必不可少的一个程序。通过渲染才能将图形设计模型或者镜头场景输出成具有真实效果的图像文件。

    渲染农场解决了数字创意过程中批量渲染的问题。所谓渲染农场(Renderfarm)其实就是"分布式并行集群计算系统",它是一种利用现成的CPU、网络负载和操作系统构建的高性能超级计算机,它使用主流的商业计算机硬件设备达到或接近超级计算机的计算能力。集群(Cluster)指的是一组计算机通过通信协议连接在一起进行同一种服务,在客户端看来就像是只有一个计算机。集群可以利用多个计算机进行并行计算从而获得很高的计算速度,也可以用多个计算机做备份,从而使得任何一个机器坏了整个系统还是能够正常运行。它的目标是使用主流的硬件设备组成网格计算能力,达到、甚至超过超级计算机的计算性能。

    采用具备超级计算能力的分布式并行集群系统来搭建渲染集群便可以轻松的解决渲染给产品制作所带来的巨大挑战。有了这样的渲染农场,企业可以用最快的时间看到作品的质量,如果需要修改也不会浪费太多的时间,这样整个作品的渲染和产出都会很轻松的实现,同时不会影响企业里其他项目的进行。

    那么渲染农场具备哪些特点呢?下面描述渲染农场的搭建所必须具备几个主要特点:

    (一)高性能

    一部全CG电影的总渲染时间是很恐怖的。通常2K电影分辨率所需要的渲染时间能被大家接受的大概在每帧1小时左右,而好莱坞主流电影的分辨率在2K、4K,甚至达到了6K或者8K,随着每一阶品质的提高而其渲染时间将是上一品质的4倍。如果场景还涉及到粒子、流体等复杂计算的时候,渲染的速度又会成倍提高,一帧画面的渲染时间可能在10小时以上。

    因此,高性能的渲染农场是用户最关注的特点之一。

    (二)高可靠性

    一套高性能的渲染农场同时也应该是一套更可靠的渲染农场,只有高可靠的渲染集群才能保证整套系统运行的高性能。

    (三)低能耗

    绿色节能、低能耗的渲染农场不但可以满足用户批量渲染的制作需求,同时可以为用户项目制作的总体投资节省大量的开支。

    (四)低价格

    由于渲染只是动漫制作中的一个环节,因此,投入到该环节的费用也是用户比较在乎的。"物美价廉"的渲染农场更能引起用户的兴趣。

    2. 曙光5000高性能计算机与渲染农场

    曙光5000高性能计算机的第一套系统于08年12月落户"上海超级计算中心",系统峰值运算速度达到每秒230万亿次浮点运行(230TFLOPS),是目前国内速度最快的商用高性能计算机系统,这标志着中国成为继美国之后第二个能制造和应用超百万亿次商用高性能计算机的国家,也表明我国生产、应用、维护高性能计算机的能力达到世界先进水平。

    曙光5000是节点以刀片为主(刀片的CPU总数超过60个),集成GridView软件和曙光机柜的高性能计算机系统;曙光5000的技术特点是:

    (一) 高性能:

    曙光5000高性能计算机采用最新的四核Intel/AMD处理器,采用基于刀片架构的HPP体系架构。

    (二) 高密度:

    曙光5000全球首次采用了4路4核的刀片服务器设计,在7U高度的机箱内可部署了40颗CPU,实现160个计算核心的计算密度。曙光5000的单机柜内可以部署5个7U高度机箱,这意味了曙光5000单机柜即可实现200颗CPU,800个计算核心的超高计算密度,理论计算峰值7.5万亿次。

    (三) 高可靠性:

    曙光5000采用了全冗余刀片服务器设计,使系统中无单一故障点,较机架式Cluster减少了70%以上的系统电缆连接。

    曙光5000A采用了曙光自主开发的Grid View集群管理管理系统。该管理系统提供统一的集中式监控平台,具备可扩展性、集成性、可靠性和易用性。使得当部署运行环境等发生异常时系统能够运行在可控的范围内,并进行准确的异常定位提示。

    (四) 低能耗:

    目前的高性能计算机能耗都非常大,动辄兆瓦级别,曙光5000在功耗方面与其他品牌两百万亿次计算机相比具有绝对优势。

    曙光积极响应国家"节能减排"、"建设节约型社会"的号召,在曙光5000中采用了多项具有大量的尖端节能措施,即使在满负载运行的状态下,功耗也仅为其他品牌同级别高性能计算机的六分之一,不带水冷系统运行时功耗为720千瓦,带水冷系统运行时功耗为1000千瓦。

    (五) 低价格

    高性能服务器的价格一直让人望而却步,但曙光5000的价格"平易近人"。百万亿次计算规模的曙光5000售价还不到1亿元人民币,为当前其他厂商同等规模高性能计算机的1/6-1/7。同时曙光5000年运营(含空调系统)耗电约800万度。

    曙光将为曙光5000提供3年全免费保修,并终身提供免费技术服务。

    曙光5000具有全系统统一的智能监控管理系统,能有效减少人工干预。

    (六) 高可应用性

    曙光5000不仅像其他品牌高性能计算机一样可以应用于高性能计算,还可以应用于动漫渲染,信息服务,电子政务,网络游戏等常见商业应用。

    在商业应用方面,由于曙光5000A使用Suse Linux 和 WCCS ,可广泛运行目前Linux和Windows下的主流的行业软件,用户不需要对普通平台上开发的软件进行任何更改,既可使用。

    由此可见,曙光5000高性能计算系统非常适合渲染农场的应用。结合曙光5000的技术特点以及动漫渲染的应用特点,我们提出了基于曙光5000的渲染农场解决方案。
 

   3. 基于曙光5000的渲染农场解决方案

    针对渲染农场的基本架构以及渲染计算的特点和需求,我们采用曙光5000来搭建渲染农场。

    采用曙光5000搭建的渲染农场,计算节点以曙光TC2600系列刀片产品为主,可选择水冷机柜和风冷机柜两种方案,同时整套系统采用GridView软件进行集中统一管理,具备可扩展性、集成性、可靠性和易用性;提供状态监控、告警管理、性能报表、机群管理、系统部署五大模块。通过高速的千兆以太网进行网络互连。同时部署曙光高性能存储系统来整个渲染农场提供数据共享。

    系统拓扑如下图所示:

    如上图所示:该总体系统拓扑图由三部分构成,第一部分是用于三维建模的前端工作站,第二部分是用于渲染的渲染农场,第三部分是后期合成部分。通过三个部分的协同工作,完成一个动画作品。

    系统中渲染农场的主要配置:

    4. 性能分析

    目前渲染领域用户常用的三维制作软件有Maya和3DMax,常用的渲染器有Mental ray、V-ray、Render Man等,不同的渲染器有不同的应用特点并且所需的渲染时间也不同。然而,无论采用何种渲染器,在相同的软件环境下,不同硬件平台渲染同一个场景文件所需的时间相差还是很大的。

    一部10分钟1280*865分辨率的片子,我们以每秒25帧来计算,那么这10分钟的总数据量大概有1500个数据帧,这并不包括设计制作期间的中间数据。这里暂不考虑中间数据,以最终的1500帧数据渲染量来计算,如下面所示:

    下面对比的是一个96MB大小的3DMax场景渲染的数据结果,该场景包含100多万个面和3000多个灯光。每一帧渲染数据大小为10M左右。

    以上数据仅从单节点单帧渲染时间来推算,并没有考虑到渲染节点与共享存储间的数据交换时间,而一旦数据交换的时间过长将会严重地影响整个渲染农场的计算效率,因此,在整个渲染农场中,单节点的计算能力只是整体性能提升的一个组成部分。而曙光5000不但提供了高性能的计算节点,同时节点间的高效互联更是保证了渲染农场的整体性能。与此同时,曙光5000的具备更高的综合性价比,无论从性能、易管理性还是高性价比方面都是动漫渲染领域用户的非常好的选择。

0
相关文章