服务器 频道

加速HPC和VDI 戴尔12G服务器特性解析

  【IT168 专稿】GPU因为能够从硬件的角度上支持3D位置和动态效果等几何处理,因此一直是进行图形渲染的重要工具,除了加速图形处理,近几年,凭借在浮点运算以及并行运算方面的优势,GPU的应用领域已经不再局限于3D图形处理,通过硬件架构的革新和优化,同时借助相关软件平台,GPU正在走向更广阔的通用计算领域。

  值得关注的是,相对于CPU而言,GPU在硬件架构和软件生态系统上还不太成熟,目前通过集成GPU来加速高性能计算应用现状如何?有哪些应用难点?未来会有怎样的发展趋势?对此,IT168邀请北京大学计算机系副主任研究员陈一峰老师一起进行了探讨。

  北京大学高性能计算中心的组成

  为了支持计算机教学,并为高性能计算提供实习和计算环境,现在很多大学设立了计算中心或高性能计算中心,而且计算能力已经成为衡量一个高校的重要指标,北京大学也不例外。

  陈一峰老师介绍,“北京大学下属有若干个部门都涉及到高性能计算,此外,也有其他的兄弟单位与北京大学合作设立了计算中心,涉及到整个计算的服务,机器管理,还包括一些技术研究。”

  谈到北大高性能计算的概况,陈老师说道:“北京大学的高性能计算中心的成员包括了北京大学各个单位,因为对高性能计算的需求来自各个方面,所以我们一起组成了一个高性能计算中心平台,这个平台涉及到了技术的推广、开发、应用,还有机器的管理,其运作一直保持着非常积极的状态。”

  具体而言,北京大学高性能计算中心的组成包括自然科学系,比如生物、化学等领域,很多人都知道,北京大学一直就见长于自然科学方面的研究,这些自然科学研究部门也具有高性能计算的需求。

  其次,北京大学高性能计算中心还包括以计算工程见长的学院,北京大学工学院具有湍流方面的应用,比如飞机、风动的模拟,石油,包括勘探和油藏模拟,这方面的实际生产需求都需要高性能计算的应用,此外,还有一些科研的应用,比如说燃烧形成的模拟燃烧。

  此外,在计算化学学院也涉及到不少的计算,包括量子化、分子化学以及粒子方面都有大量的应用,比如核爆炸过程的模拟。在天文方面,利用高性能计算来处理宇宙学,模拟整个宇宙大爆炸的过程,或者是星系形成的过程,还有黑洞演化的过程。这些都是非常有代表性的科学应用领域。

  这其中,比较特殊的是陈老师工作的信息学院,因为它既是高性能计算的使用者,也是高性能计算的提供者,陈老师介绍,在北京大学中,在信息学院提供技术的开发和推广下,学校内部已经有各方方面面的应用可以受益于GPU的加速技术。

${PageNumber}

  集成GPU技术带来的应用难点

  在谈到目前集成GPU的高性能计算应用方面的难点时,陈老师表示,主要来自两个方面,分别是硬件和软件。目前的硬件发展速度是指数级的,其体系结构必然是越来越复杂,走向大规模的并行必然是一大趋势,并行计算也一直都是计算机领域很重要的研究问题。这也带来了能耗方面的问题。

  相对于硬件的快速发展,陈老师强调,软件技术的发展以及软件技术在各种不同领域的用户间的推广相对来说就较为落后了。具体而言,在软件方面,很多现有的系统软件,包括比较低层的系统软件,在设计和开发的过程中,都不是在有加速器的体系结构上开发的。所以在新的大规模的应用上,或者是环境下,它会出现很多新的问题,包括文件系统、通讯、系统的不稳定性。

  此外,陈老师特别强调,现在重视非常不够的是技术的推广,现在的GPU可以应用在各个领域,但出于很多挑战,现在其应用还是手工作坊式的程序移植,对现在很多现有的软件技术用户还不太熟知。因此,在陈老师所在的研究小组便是致力于这方面的研究,其主要工作是开发新的软件工具帮助用户去做软件的移植。

  “因为这些技术是新技术,大多数用户还没有来得及去接触、消化、吸收,更不用说落实到应用上,而且这也需要一个过程,从整个产业的角度来说,要从最弱的环节施加最大力的扶持和支持。”陈老师补充道。

  尽管应用存在一定的难点和障碍,但谈到基于GPU的高性能计算应用,陈老师显得相当乐观。陈老师介绍,在有些应用场景以及计算业务下,它表现的完全良好,但是在另外一些应用下,因为这些应用对系统的压力是不一样的,包括存储的压力,包括通讯的压力,因此在不同压力的变化下,这些节点会出现问题。

  因此,需要从软件技术上去保证可靠性,虽然在一个不甚完美的硬件系统上,仍然能够做正确高效的计算,而这也带来了一系列的低层软件、中层软件,包括程序设计,软件开发等课题。“但是我觉得从我们这个小组,包括我们自己的经验,以及我们了解国际上的一些新的进展看起来,GPU集群,包括GPU大规模高性能计算的应用,完全是可行可用的。”

${PageNumber}

  灵活的集成GPU技术方案实现HPC

  随着基于GPU的高性能计算应用越来越多,在这项热点应用的驱动之下,已经有越来越多的服务器厂商推出了根据对GPU进行集成优化的服务器产品以及方案。戴尔PowerEdge C系列的服务器就是专门针对于集群优化共享的基础架构服务器,在刚刚推出的12代服务器中,就具有多款对于GPU技术优化的服务器产品,比如说C6220,以及C410X,以及C6145等,除了这些C系列的服务器之外,戴尔塔式,以及机架服务器产品同样也根据GPU应用部署了一些内置GPU的服务器方案,比如说T620,以及R720,以及刀片服务器M610X等等,可以通过更加密集型的计算类型来实现更加卓越的高性能计算应用。

  如今,数据中心的空间和电力限制问题日益凸显,所以在在有限的空间内,实现更加密集的计算无疑是未来的发展方向和趋势。在戴尔全新的PowerEdge R720服务器中,就可以在2U的机架服务器的空间内集成两颗英伟达GPU,实现更高密度的计算。除此以外,在戴尔的桌面与工作组产品系列中,PowerEdge T620服务器可以实现4颗英伟达GPU的集成,同样也是实现更加高密度计算的方式。同时,T620也支持虚拟桌面基础架构解决方案,适用于医疗成像等应用。

  作为在PowerEdge C系列中主要应对密集型GPU技术应用的服务器产品,戴尔PowerEdge C410X在高密度运算方面有了非常好的提升,可在3U的高度里,正面的可提供十个PCIE模块的支持,同时,在背面具有六个PCIE模块的支持,所有PCIE模块支持半高以及全高的GPU模块,主要面向于能源、生物、医学成像、化学领域等高性能计算应用。

加速HPC和VDI 戴尔12G服务器特性解析
▲PowerEdge C410X正面

加速HPC和VDI 戴尔12G服务器特性解析
▲PowerEdge C410X背面

加速HPC和VDI 戴尔12G服务器特性解析
▲戴尔PowerEdge C410X PCIE模块

  除了在服务器内部实现对GPU更好的集成,戴尔在GPU外置方面也推出了一些相应的解决方案,使得对HPC系统灵活扩展更加容易。单个PowerEdge C410X PCIE模块就可以提供对半高以及全高的GPU模块的支持,同时它也支持英伟达下一代开普勒架构的GPU。除了可支持PowerEdge C410X,PowerEdge C410X PCIE模块同样适用于戴尔广泛的服务器类别,比如说R720、C6142等,在戴尔PowerEdge服务器家族中保持着良好的通用性。

0
相关文章