服务器 频道

Tesla个人超级计算工作站解决方案

  【IT168资讯】HP工作站 + Tesla高性能计算解决方案

  目前在NVIDIA网站上的Tesla C1060兼容平台列表中,包括了惠普HP xw4600、xw6600、xw8600和xw9400(AMD平台)工作站。

  Tesla C1060专用系统

  供应商 型号 配置已经过测试 注

  HP xw4600 RHEL 5.2 64-bit  

  HP xw9400 Windows XP 32-bit

  Windows XP 64-bit

  RHEL 5.x 32-bit

  RHEL 5.x 64-bit  

  HP xw8600 RHEL 5.x 64-bit

  RHEL 4.5 64-bit 测试两块C1060

  需要两个6针至8针的转接器

  或者两个4针至6针的转接器

  HP xw6600 Windows XP 32-bit 

  注:以上表格来自NVIDIA官方网站

  下面是北京科卓推出的三款基于HP工作站平台的Tesla高性能计算系统:

  1.科卓Quadro 4100-TC

HP xw4600 + NVIDIA Tesla C1060

  科卓Quadro 4100-TC 产品规格

  主机 惠普HP xw4600工作站

  芯片组 Intel X38

  CPU Intel Core 2 Quad Q9650 3.0GHz 12MB/1333MHz FSB

  内存 4GB (2x2GB) DDR2-800 ECC 双通道

  硬盘 500GB SATA 7200rpm

  电源供应 475W 80+

  显卡 NVIDIA Quadro NVS 290

  计算处理器 NVIDIA Tesla C1060

  科卓Quadro 4100-TC在HP xw4600工作站基础上选择了性能强大的Intel Core 2 Quad Q9650四核处理器,适用于CPU+GPU异构计算。如果您的应用对CPU的多线程处理能力要求不高,可以考虑更换为相对廉价的双核处理器。

  2.科卓Quadro 8100-TC

HP xw8600 + NVIDIA Tesla C1060

  科卓Quadro 8100-TC 产品规格

  主机 惠普HP xw8600工作站

  芯片组 Intel 5400

  CPU 2×Intel Xeon E5405 2.0GHz 12MB/1333MHz FSB

  内存 4GB (2x2GB) DDR2-667 ECC FBD 双通道

  硬盘 300GB SAS 15000rpm

  电源供应 800W 80+

  显卡 NVIDIA Quadro NVS 290(可选Quadro FX系列3D专业显卡)

  计算处理器 NVIDIA Tesla C1060

  科卓Quadro 8100-TC使用HP xw8600高端工作站平台,基本配置为2个Intel Xeon E5405四核CPU,4GB内存和300GB SAS企业级硬盘(可以根据需要选择更高配置)。8个物理CPU核心能够更好的配合Tesla C1060的运算工作。该方案还有一个特点:对于那些需要良好的OpenGL或者Direct3D显示性能的用户,可以选配Quadro FX系列3D专业显卡。(注:NVIDIA Tesla C1060计算处理器不具备显示功能)

  3.科卓Quadro 8100-TC II

HP xw8600 + 2×NVIDIA Tesla C1060

  科卓Quadro 8100-TC II 产品规格

  主机 惠普HP xw8600工作站

  芯片组 Intel 5400

  CPU 2×Intel Xeon X5450 3.0GHz 12MB/1333MHz FSB

  内存 8GB (4x2GB) DDR2-667 ECC FBD 四通道

  硬盘 450GB SAS 15000rpm

  电源供应 1050W 80+

  显卡 NVIDIA Quadro NVS 290

  计算处理器 NVIDIA Tesla C1060 ×2

  科卓Quadro 8100-TC II与前面8100-TC最大的区别在于把Tesla C1060计算处理器增加到2块,从而使流处理器浮点运算性能轻松翻倍。同时在上一套方案的基础上,将CPU升级到3.0GHz主频的Xeon X5450(如有需要还可选择更高的X5472、5492等处理器),内存标配8GB(最大支持128GB),硬盘选择了目前15000rpm企业级硬盘中容量最大的450GB SAS(还可以增加硬盘数量并组建RAID)。由于每块Tesla C1060的最大功耗达到200W(典型功耗160W),而X系列高性能Intel Xeon处理器的单个功耗也有120~150W,因此配备1050W大功率电源很有必要。

  三、相关应用案例

  1.CAD/CAM/CAE

  挑战

  ________________________________________

  虚拟时装表演能否成为未来的潮流? 这一问题尚不确定,但以色列佩塔提克瓦的OptiTex Ltd.公司已经利用其3D计算机辅助设计/计算机辅助制造(CAD/CAM)设计技术将整个设计业带入了全新境界。

  传统上,设计师必须真正创造出实际衣物线条的织物样品来进行原型制作以及为潜在投资者提供展示。这是一个相当耗时且代价高昂的过程,会产生很大的浪费。 OptiTex 3D实现了这一过程的现代化。该软件通过让设计师在虚拟模特身上模拟衣物设计的外观和运动,从而让他们在剪裁第一块布料之前就能够审视、优化以及衡量这些样品。

  解决方案

  ________________________________________

  为解决这一设计难题,OptiTex利用NVIDIA® CUDA™软件开发环境来重新构建其衣物模拟引擎的数据与算法以使其能够在GPU上运行。 GPU计算解决方案让开发人员能够消除CPU环境下的瓶颈,最高实现10倍的性能提升。 季节性系列产品的开发时间一般为190天。但是使用了重新构建的OptiTex 3D解决方案之后,上市时间被缩短为短短的35天。

  OptiTex, Ltd.公司总裁兼首席执行官Ran Machtinger表示:“OptiTex 3D向GPU平台的转变大大提升了我们产品的效率,进一步为我们的客户提供了巨大效益。 有了实时能力,制版过程将彻底改变。 纺织业客户将不必依赖用户体验以及详尽的测试来确定最终版型,因为人们始终可以在3D模式下查看这些服装。

  影响

  ________________________________________

  由于GPU计算解决方案带来了实时性能,因此设计师能够降低生产成本并缩短设计周期时间。 服装、汽车、航空等各行各业的用户实际上无需浪费布料、纸张、用电、工时以及快递费用,从而节约了材料、电力、以及制造费用。

  如需了解更多信息,敬请访问 www.optitex.com


  2.计算流体动力学

  美国国家大气研究中心

  挑战

  ________________________________________

  从致命的飓风到全球气候变化,天气是影响我们日常生活最大的不可控制因素,有时甚至会决定我们是生死存亡。然而,现在天气情况的早期预测变得更快、更精确,这样就为人们提供了更长的准备时间。在美国国家大气研究中心(NCAR),一支科学家队伍已经开发出即时、长期以及短期天气条件的复杂的预报模型。

  气象研究与预报模型(WRF)是世界上应用最广泛的模型,其用户包括美国国家气象局、空军气象局、国外气象局以及商业性天气预报公司等。美国国家大气研究中心气候与气象模型正从Tera级(1万亿FLOPS)向Peta级应用程序转变,其发展速度比传统计算群集的更快,而添加更多CPU已经无法有效提升速度。这种问题在应用程序包含实时组件或其它在时间上有要求的解决方案时尤为突出。

  解决方案

  ________________________________________

  在提升总体预报速度与精确性方法的调查过程中,美国国家大气研究中心的技术人员与科罗拉多大学波尔德分校的研究人员展开合作,转向NVIDIA GPU计算解决方案。在移植到NVIDIA® CUDA™之后,微观物理学速度提升了10倍。微观物理学是至关重要、但又非常耗费计算资源的气象研究与预报模型部件。虽然微观物理学由不到百分之一的模型源代码构成,但是将其转化为CUDA还是实现了整个模型20%的速度提升。

  气象研究与预报模型主要软件开发人员、美国国家大气研究中心的John Michalakes表示:“当我们在传统群集上为高时效性预报而用尽全部系统动力时,这一结果的及时到来相当鼓舞人心。由于我们能够把NVIDIA的GPU计算技术整合到更多的气象研究与预报模型中,因此我们的目标是将预报时间至少缩短两倍。我认为加速器的作用将彻底改变气象与气候的建模。”

  影响

  ________________________________________

  现在美国国家大气研究中心以及全世界依赖气象研究与预报模型的多家机构均能够更快地发布人们迫切需要的实时天气事件预报以及发展动态。结果,人们将能够为这些天气事件早做准备并预防损失。

  如需了解更多信息,敬请访问: www.ncar.ucar.edu

  3.地理信息服务

  挑战

  ________________________________________

  地理信息服务(GIS)技术对安全以及我们日常生活质量有着重大的影响。城市规划者以及规划公司使用地理信息服务应用程序来将物理地图信息与人口统计资料结合起来,这些资料包括人口数量、街道布局以及本地资源。从追踪911电话、研究二氧化碳浓度到监控杀虫剂的应用,这类应用程序应用越来越多。

  由于用户需求不断超越地理信息服务应用程序的范围,因此数据集变得越来越复杂,常常需要处理显示向量层、表面层以及图像的数G级字节的互动地图。Manifold.net是一家领先的地理信息服务系统开发商。在市场的迫切需求下,Manifold.net必须开发出能够高效、绝对准确地处理最大数据集的产品。对于这些如此先进的项目以及预计会越来越多的功能需求,该公司意识到基于CPU的计算解决方案已无法满足用户的需求了。

  解决方案

  ________________________________________

  Manifold于是就将其软件转到NVIDIA® CUDA™平台下,让用户能够享受到GPU的并行处理能力以及由PCI Express高带宽支持的数据互动。凭借CUDA配置,从前需要20分钟才能完成的运算现在30秒内即可完成。而且,从前需要30秒到40秒的运算现在达到了实时运算。

  Manifold.net产品部经理Dimitri Rotow表示:“说NVIDIA CUDA技术是计算机科学界自微处理器问世以来最具革命性的发明一点都不为过。该技术速度快、价格低并且具有很大的潜力。NVIDIA CUDA太重要了,因此所有Manifold的用户都应坚持采购支持CUDA的计算机硬件。”

  影响

  ________________________________________

  凭借其全新的CUDA加速,Manifold正在帮助开采之前无法开采的燃料矿藏、追踪空气中污染物的情况以及为警察和火警提供更加准确的信息。

  如需了解更多信息,敬请访问: www.manifold.net


  4.成像

  挑战

  ________________________________________

  人人都已经习惯于现代医疗机构紧密的时间安排,在这些地方,半小时的预约就像整天一样漫长。因此,这种环境中的实用技术需要具备极快的速度,以便配合当今快节奏的医疗实践。 患者需要快速、精确并且舒适的诊断,而医生则需要能够实现高效诊断的工具。

 

  新一代成像系统全乳房超声波(WBU™)系统正是为了进行这些检查而开发设计。Techniscan Medical System公司的开发人员在开发这一全新成像系统时面临着这些挑战。

  然而,在开发的早期,使用多台联网计算机进行运算,检查结果通常需要花费数小时才能得出。 即使是采用最新Xeon处理器的16台计算机组成群集也无法在一天时间里完成众多患者的扫描检查。

  解决方案

  ________________________________________

  为解决这一难题,Techniscan公司将其专有的逆向散射算法从传统的FORTRAN以及MPI系统上移植到NVIDIA® CUDA™上。 在测试了该配置之后,开发人员完全被测试结果所折服。因为他们发现,这种配置在不损失检查结果画质的情况下能够使系统更快地运行。

  Tesla计算系统可为全乳房超声波系统提供足够的动力,使其符合医疗行业的快节奏要求。 四颗Tesla GPU处理器的配置就能够在不到20分钟时间里完成Techniscan算法的处理。 通过比较,传统16核计算机系统耗费了超过两倍的时间。

  Techniscan现已将扫描仪内置的群集全部替换为两个强大的并行NVIDIA® Tesla™ D870桌边型GPU计算系统,用来处理逆向散射代码。

  Techniscan公司高级软件工程师Jim Hardwick表示:“CUDA让我们能够极其轻松地利用GPU超强的处理能力,为我们节约了许多时间和成本。 一台主机系统以及两个Tesla D870系统远比16核群集便宜得多。 这不仅在成产与销售方面意义重大,而且还大大降低了设计过程中的研发成本。”

  影响

  ________________________________________

  通过使用具备NVIDIA的GPU计算技术的Techniscan系统,放射科医师就可以进行完整的超声波扫描并在患者就诊的30分钟内得出结果。 这样就消除了检测结果的延迟时间,患者与医生都能够依靠这一高效快速的设备在当代医学的快节奏下得出检测结果。

  如需了解更多信息,敬请访问 www.techniscanmedicalsystems.com

  TechniScan WBU™ 系统目前只是一种实验设备,尚未得到美国食品及药物管理局(FDA)的许可。

  5.生命科学

  美国伊利诺伊大学:

  纳米级分子动力学/视觉分子动力学

  挑战
  ________________________________________

  伊利诺伊大学厄本那-香槟分校(UIUC)纳米级分子动力学(NAMD)以及视觉分子动力学(VMD)都是功能强大且应用广泛的工具软件,它们被用于生物分子过程的模拟和可视化。模拟复杂的分子系统是一件耗时的工作,而且还需要使用巨大、复杂的计算机群集才能完成。

  解决方案

  ________________________________________

  为了提高性能,伊利诺伊大学厄本那-香槟分校的研究人员将“cionize”离子排列工具移植到了NVIDIA GPU计算解决方案上。其目的就是为运算生物学分子与离子的互动而加快计算量超大的内核速度。通过移植,伊利诺伊大学厄本那-香槟分校的研究人员在离子模拟方面获得了比18颗CPU的群集高出100多倍的速度提升(以CPU总时间对比GPU总时间为基础计算得出)。

  采用一台三颗GPU的工作站时,类似的视觉分子动力学工具中的时均化静电运算达到了705 Gigaflops的浮点性能。这种超高的性能让所有生物学研究人员的工作站均能够达到等同于计算群集的计算能力。

  影响

  ________________________________________

  有了GPU计算,这些分子模拟就不再受到群集的服务器空间限制了。通过在个人实验室的工作站以及台式机上运行模拟,项目不再因计算资源稀缺而互相争抢。与从前只能排队等待处理相反的是,研究人员在需要时可及时获得运算结果。

而且,大型服务器群集拥有了GPU之后,更复杂的难题就能够得以解决。而这种计算能力一年前还只是一个梦想。

  纳米级分子动力学与NVIDIA计算解决方案的结合是前沿技术研究与软件开发的珠联璧合,其目的就是利用全国最快的超级计算机来解读活体细胞的最小组件。这些全新的计算工具正在加速药品研究以及解释生物进程中其它至关重要的研究步伐。

  如需了解更多信息,敬请访问: http://www.ks.uiuc.edu/

  挑战

  ________________________________________

  Evolved Machines正在从事大脑回路反向工程的研究工作,以期开发出设备技术的一个全新典范。他们的研究工作需要进行神经生物学真实神经回路的大规模模拟,这就需要强大的并行计算能力。单个神经元的模拟每秒钟要进行2亿次微分方程式的估算,大约需要4 gigaflops的浮点性能。负责处理感官的神经阵列需要数以千计的神经元,因此神经系统的实时精细模拟则需要10 teraflops以上的浮点计算能力。

  解决方案

  ________________________________________

  Evolved Machines于2006年与NVIDIA®(英伟达™)公司在GPU方面首次展开了合作。与采用当代x86微处理器进行模拟相比,他们将速度提升了大约130倍。他们现在正在进行GPU机架的设计,该产品成本只有世界优异系统的百分之一,而性能却可以与之相媲美。

  影响

  ________________________________________

  Evolved Machines公司正在开发的应用程序包括视觉物体辨识以及味觉辨识程序。为了开发出能够学习物体进而在真实环境中辨识这些物体的设备,人造神经回路需要在接受感官输入期间逐渐“连通”,就像婴儿出生后六个月内学习辨识环境中的物体一样。

  有了GPU(图形处理器),具备学习能力以及感知气味能力的设备就成为了可能。这些设备可用于在现实环境中检查爆炸物或监控食品新鲜度。在利用内容以及自动导向机器人所采集图像构建数据库这一领域中,图像检测技术的进一步发展能够利用神经模拟数据处理来实现当前所无法实现的功能。

 

  挑战

  ________________________________________

  Boston Scientific 公司主要设计和制造可以安全使用核磁共振成像和其他诊断成像工具的心脏起搏器和其他生物医学植入片。这种工作所需的设计仿真不仅需要密集的计算,而且需要在标准计算机集群上运行相当长的时间。

  解决方案

  ________________________________________

  Boston Scientific 选择了 Acceleware 推出的获得专利的仿真解决方案,这款解决方案融合了 Schmid & Partner Engineering AG 的 SEMCAD X 软件和 NVIDIA GPU (图形处理器)计算解决方案。最终,Boston Scientific 公司的工程师在仿真工作方面的效率最多提高了 25 倍。Acceleware的解决方案为 Boston Scientific 公司带来了 NVIDIA GPU (图形处理器)计算基础架构的高性能运算能力,大大降低了测试不同设计所需的时间,同时,每位工程师的桌面工作站现在也都具有了集群计算能力。

  影响

  ________________________________________

  借助 Acceleware 的解决方案,Boston Scientific 的工程师可以更有效地研究多种设计变量的影响和它们之间的依赖性。这些优势不仅使该公司的仿真工作能够更快地进行,从而生产出成本较低的设备,同时还促进了用于模拟人体生物医学过程的新算法的开发。

  Schmid & Partner 软件部主管 Nik Chavannes 表示:“NVIDIA 硬件产品使电磁模拟的处理速度至少提高了 25 倍,将医学产品的分析和优化工作的难度降低到了难以想象的水平 — 即使在两年前也没人能够想到。NVIDIA 和 Acceleware 的解决方案为电磁学的发展开辟了一个全新世界。”

  有关详细信息,请访问: www.acceleware.com

  有关 Boston Scientific 的详细信息,请访问: www.bostonscientific.com

  Acceleware公司以及美国威斯康星大学麦迪逊分校

  加速乳腺癌的检测

  美国威斯康星大学麦迪逊分校的研究人员正在研究采用电磁波短脉冲的新方法来检测和治疗早期乳腺癌。

  挑战

  ________________________________________

  乳腺癌越早检测出来,存活的几率就越大。Susan Hagness博士以及一支多学科科学家队伍正在研究利用低功率电磁波超短脉冲来生成乳房的三维诊断图像,并利用更高功率的电磁波来将能量聚集到肿瘤上,从而达到治疗癌症的目的。该技术通过无伤害的乳房扫描所得到的诊断信息可作为乳房X光照相术的补充,可以用于检测乳腺癌以及在不手术的情况下的乳腺癌治疗。然而,该技术把所生成的数据构建成图像则需要大量反复、耗时的运算。

  解决方案

  ________________________________________

用于检测乳腺癌的乳房计算模型(顶部截面显示了异形组织成份),周围是一系列用来发送和接收电磁能短脉冲的天线。

  美国威斯康星大学麦迪逊分校的研究人员采用了Acceleware硬件加速平台,该平台利用NVIDIA GPU(图形处理器)计算解决方案的计算能力极大地加快了该技术所要求的复杂计算的速度。Hagness博士表示:“我们为检测乳腺癌而研发的全新的乳房成像技术整合了逆向散射方案等算法,这些算法需要占用相当大的计算机资源。Acceleware的解决方案为我们提供了更高数量级的运算加速,使图像的生成从数天变为短短是几个小时。”本技术可提供精细的乳房三维图像,比传统的二维乳房X光影像更易于解释和定位潜在的问题。

  影响

  ________________________________________

实际乳房内部数值影像的横截面(左)以及采用威斯康星大学麦迪逊分校微波逆向散射技术、使用Acceleware硬件计算出来重建图像(右)。最黑的区域代表肿块。

  对包括乳腺癌在内的多种癌症来说,发现的越早就越有利于癌症的治疗和治愈。1 通过使用Acceleware/NVIDIA解决方案,完全扫描乳房之后生成微波影像的时间现在仅需几个小时即可完成,从而快速地为医师提供了更高质量的三维图像,让他们能够根据图像做出诊断与治疗决策而无需进行不舒服或创伤性的手术。Hagness博士以及她在威斯康星大学麦迪逊分校的团队都希望这项技术将来能够用来更轻松、舒适地治疗病人。这些研究成果拥有良好的前景以及合理的价位,这项技术有望在将来得到推广应用。

  更多信息:

  有关Acceleware及其产品的的更多信息在其网站上有详细的介绍,网址为: www.acceleware.com.

  1 http://www.cancer.org

 
  6.石油天然气

  挑战

  ________________________________________

  石油天然气勘探的难度越来越大。现在的大型油气田深度变得更大,并且处于难以分析的沉积层内。例如最近Jack Field在墨西哥湾发现的油气田就位于海底以下2万多英尺。为了解释和勘探这些油气田,我们必须获得并处理大量的地震数据。由于沉积层非常复杂,因此更好地解决办法是以图像的形式来呈现。这就意味着需要处理更多的数据。

  解决方案
  ________________________________________

  在大多数人仍然把GPU当作是消费类游戏技术时,总部位于休斯敦、专门从事地理数据分析的Headwave公司就已经开始研发能够利用显卡并行处理能力的下一代计算平台了。

  在NVIDIA® GPU计算解决方案上运行的Headwave解决方案让地球物理学家能够对他们的数据进行高级过滤处理并即时地查看结果,即使是高达数TB的数据集也能实现即时查看。此外,地球物理学家还可以每天都多方面地分析最初获得的地震(“叠前”)数据。

  TB级数据集的传统处理方式需要长达几个月的人工以及数月的数字运算时间。Headwave推出的产品让地球物理学家能够对他们的数据进行高级过滤处理并即时地查看结果,即使是高达数TB的数据集也能实现即时查看。通过采用NVIDIA GPU计算解决方案,Headwave能够将运算速度提高100倍并将人工操作时间缩短100倍。

  影响

  ________________________________________

  如果没有NVIDIA的GPU计算解决方案的最新进展,我们就不会实现TB级数据集的实时处理。石油天然气公司的工作站已经配备了GPU,这就意味着大量硬件基础设施已经具备利用这项技术的条件。因此,石油天然气公司正着手开始利用这项全新的技术。

  挑战

  ________________________________________

  随着石油价格持续攀升,寻求新能源来帮助调节油价已经变得越来越紧迫。 但是勘探和钻探一口深井的成本高达数亿美元,而且通常成功的几率很低。

  为最大限度降低风险,现在大多数石油勘探都依靠SeismicCity等公司的3D地震成像技术来细致地查看潜在的钻探点。SeismicCity公司设在美国德克萨斯州休斯顿市。复杂地质段的成像仍然是一项具有里程碑意义的任务,它涉及的复杂数据多达太字节(TB)。

  随着深度成像技术开发商SeismicCity连续推出几代更快、更精确的代码,他们遇到了一个棘手的问题: 每次升级到其专利算法都会令计算复杂程度提高10倍。 不久前,SeismicCity现有的硬件配置已无法满足需要,因为新算法要求系统升级到等同于20 000颗CPU的配置。

  解决方案

  ________________________________________

  SeismicCity为满足未来之需,转而采用了GPU计算,在NVIDIA® Tesla™ S870 1U服务器系统上运行NVIDIA® CUDA™。 这一强大的并行计算架构可实现达到从前CPU配置20倍的性能提升。 而基于CUDA技术的NVIDIA下一代Tesla处理器可将性能再提升3.5倍。 而且,GPU的可扩展能力将更快地实现这种向新算法的过渡,让硬件平台能够随需求的增加而得到扩展。

  SeismicCity公司技术副总裁Claude Pignol表示:“SeismicCity的一个独特之处是其算法。 从上一代代码变为新一代代码意味着其精确度大幅提高的图像将直接导致勘探效率的提高。 NVIDIA的GPU计算技术让我们能够更快、更经济地采用下一代算法。

  影响

  ________________________________________

  凭借SeismicCity公司3D深度成像技术在速度与精确性上的大幅提升,人们将勘探到新的潜在油田。 从前由于地震数据不清晰而导致无法确定某些区域,钻井工人现在可以在这些区域更加自信地实施开采了,这样就使国内急需的石油产量能够得到增长。

  如需了解更多信息,敬请访问 : www.seismiccity.com


  作为HP惠普工作站产品增值合作伙伴和ELSA艾尔莎专业产品全国分销平台的北京科卓同创信息技术有限公司,长期以来一直致力于为用户提供性价比更高的图形工作站及相关产品解决方案。

  北京科卓同创信息技术有限公司

  地址:北京市海淀区苏州街3号大河庄苑6号楼1601室

  电话:010-82569239/82569530

  网址:http://www.quadro.net.cn

 


 

0
相关文章