服务器 频道

CAPS:异构趋势下 并行软件算法需优化

  【IT168 专稿】随着CPU的主频瓶颈不断凸显,因为具备更多的计算内核和极高的并行计算效率,GPU等加速器在HPC领域迅速普及。AMD以及NVIDIA公司均针对HPC应用推出了专门的加速器产品,包括英特尔的“至强融核”(Intel Xeon Phi)协处理器也计划在年底推出。

  在实现百亿亿次/秒计算的道路上,CPU+协处理器的异构架构被认为是很“明朗”的一条道路,但是随着处理平台的快速发展和革新,也带来了新的难题,那就是用户应用软件的移植和优化。

  如何让用户接受异构架构并部署和应用好异构架构恐怕是更加现实的问题,作为在众核系统上部署应用程序的供应商,CAPS公司提供应用移植与优化的整体解决方案,从而提升整体应用性能。

  不管是从硬件还是软件层面,异构架构都将给传统的硬件系统和软件平台带来冲击和挑战,那么异构架构对目前的传统硬件系统和软件平台带来怎样的冲击和挑战?在实现百亿亿次/秒计算速度的进程中,又有哪些需要突破的技术应用难点呢?对此,CAPS entreprise公司的CTO Dr. Francois BODIN进行了解析。

CAPS:异构趋势下 并行软件算法需优化
▲CAPS entreprise公司CTO Dr. Francois BODIN

  “CAPS entreprise是一家众核架构(像NVIDIA GPU或Intel MIC)部署应用程序解决方案的领先供应商,是OpenACC和OpenHMPP标准的创始人之一,同时还是欧洲高性能计算重大研发项目的成员之一。”对于不太熟悉CAPS entreprise公司的朋友,Francois这样说道。

  异构架构下的软件优化难题

  在Francois看来,异构架构方式来实现百亿亿次/秒计算速度已成大势所趋,基于加速器的架构是一个重要组成部分。但是他强调在这个过程中需要解决的三大难题:

  1. 改进能源效率难题:Francois表示,解决能耗问题是实现百亿亿次/秒计算速度的关键,是HPC领域重大的全球性长期趋势,对HPC用户而言也同样如此。“功耗在衡量一个计算系统成本中是一个决定性的参数,我们需要超级计算机的性能并减少能耗,加速器能够提供很高的性能和能源效率。” Francois说道。

  2. 解决容错难题:对于数以百万计的计算内核,而处理错误时间需要非常小。Francois介绍,未来大规模系统的平均出错间隔将以几分钟来衡量,即使有错误发生,应用程序也必须能在系统上一直运行。

  3. 前所未有的并行规模难题:Francois强调,这种并行是多级别的,包括节点内多级别并行、跨节点多级别并行以及多线程向量计算以及正确性问题。

  “毫无疑问,使用高度并行的设备来获取计算性能并不是一件容易的事情,编程的复杂性就是获得高性能所付出的代价。”由于单核内存读取带宽无法提高,原有的技术是不够的,Francois表示:“为了实现百亿亿次计算,我们需要新的程序设计技术标准,新的算法,尤其是并行算法。”

  此外,原有的遗留代码也不能被忽略,因为这些上亿行的遗留代码难以承受完全重写的代价。“我们要将遗留代码过渡到大规模并行,并保证它们和新代码新算法之间相互的契合性。CAPS公司坚信制导语句的编程方式能很好的利用遗留代码,混合先进的平行代码生成技术和大部分程序员使用的代码语言。”Francois如是说。

  GPU和MIC的比较

  英特尔即将正式推出的MIC(即Intel Xeon Phi)协处理器将会给HPC领域带来怎样的影响?Francois表示,从中立和客观的角度来说,GPU和MIC各有优势,比较GPU和MIC各自到底更适合哪一类计算,必须根据应用的代码结构,具体应用具体分析。CAPS编译器是支持NVIDIA、AMD和Intel MIC的多平台产品。

  Francois强调,不管是GPU集群还是MIC集群,代码的可移植性都是非常重要的。随着GPU和MIC都是朝着大规模并行的目标往前发展,能耗将是两者共同面临的重要问题。

0
相关文章