服务器 频道

浅谈大型服务器在HPC中的应用

        【IT168 应用】  没有人否认,分布式集群技术让高性能计算在不断突破峰值纪录的同时,迅速走向普通大众,上世纪80-90年代还是巴统组织的禁运技术,现在已经高校、科研等领域的普通生产工具。因而有人认为,既然集群技术能够以scale out的方式,用低性能设备累加出高性能表现,那么scale up的大型服务器已经没有用武之地。但是事实真是这样吗?

  重卡之于轻卡

  集群技术的思想很简单,就是用 “N台轻型卡车协同完成一台重卡的运载任务”。但是10台轻卡并不等于一台重卡,现实中有许多无法分割的大型货物离不开重卡,同样,高性能计算中也有很多计算任务,不能有效分布并行化,而离不开高扩展、高性能的大服务器,这些服务器在高性能计算中被称为胖节点。当前高性能的胖节点有比例不断增大的趋势,这主要源于Open-MP计算程序的广泛应用,以及胖节点在完成大型计算任务时的优势。

  大型服务器在高性能计算应用中与中低端服务器的关键区别就是多处理器(8颗以上)共享大容量内存(通常为4路及以下服务器的2倍以上)在进行大模型计算时,大内存允许中间数据存储在内存中,而不需要和硬盘交换数据,可以减少I/O频度,明显提高计算速度。有时I/O问题是大问题求解的杀手,因此从技术上看,大型服务器设备具有更大优势。但是,真正导致高性能计算离不开大服务器的,是广泛应用的Open-MP程序。

  大服务器与Open-MP

  基于Open-MP开发编译的应用在CAE、计算化学、生命科学、石油勘探、环境科学等行业领域随处可见。Open-MP是一个共享存储方式的并行编程标准,它采用“制导语句”的方式实现,即在原有的串行程序中插入一些指导并行的语句,因此,Open-MP非常适合将原有的串行程序改造为并行程序。当前GCC、Intel、PGI、MS VS.net等主流编译工具均提供对Open-MP的支持。但是Open-MP只适用于硬件共享存储的计算设备,如多核芯片、多处理器节点等,而不能跨节点运行,因此Open-MP程序离不开多处理器共享容量大内存的大型服务器。

  浪潮TS850,理想的胖节点

  2010年,浪潮推出了第一款中国自主设计的八路服务器TS850,为Open-MP程序和大模型计算做了大量的专门设计,作为胖节点可以在性能、内存方面极好地满足实际应用需求。相比四路胖节点,TS850具有更多CPU核心,最大支持80处理器核心,160个线程;更大的共享内存,最大支持2TB内存。同时胖节点TS850在设计上完全按照高端需求设计,支持20余项RAS特性,在可靠性、可扩展性、可管理性和可用性方面具有优异表现。现在HPC遇到的问题是,随着系统规模扩大,出故障的概率就会增大。而系统本身的平均无故障时间越长,系统越可靠,做容错和高可用的代价就会越小。TS850在承载重任的同时,还能有效降低用户总体成本。目前,该产品已经在天河一号工程、山东大学等多个大型高性能平台成功应用,下面简单介绍该产品在不同应用领域的解决方案和具体表现。

  CAE

  CAE即计算机辅助工程设计,在航空、航天、能源动力等工业领域有着广泛应用,CAE大计算量的特点决定了需要大容量内存。对大内存的支持让CAE在前后处理方面获得自由,使其在大模型的建立、大图形的处理以及大数据库的操作方面几乎没有障碍,用户可以建立高保真模型。

  对于CAE类的应用,比如Ansys和ABAQUS,在某些网格数目巨大,并且网格划分负载不平衡的情况下,采用MPI的效果非常差,必须采用Open-MP才能达到良好效果,并且对于这些隐式有限元分析软件,其本身算法决定了扩展性不会太好,单机计算能力才是重中之重。 中国科技大学的CAE领域科研计算工作面临着通用节点无法提供大容量共享内存,一些大模型的计算小节点无法完成,多节点使用并行效率又很低,每次模型的修改都会浪费大量时间。浪潮HPC综合解决方案中胖节点选用高端八路服务器TS850为中国科技大学化解了此项难题。浪潮TS850采用共享大内存并行系统架构,能够提供相足够的共享内存来运行此类程序,提高程序的运行效率。

0
相关文章