服务器 频道

英特尔:高性能计算系统与应用强调平衡

  三、根据应用选择合适的处理器

  不同的高性能计算应用有不同的特点,有的偏重内存带宽,有的是计算密集型,有的需要高度并行,因此不同应用对计算资源的需求不一样,为此,英特尔通过至强多核CPU和即将问世的众核处理器给出了不同的答案

根据应用特征来选型和优化
▲不同应用有不同的计算特征

  对于大多数的主流高性能计算应用来说,至强5600和即将在2011年下半年推出的至强E5都是很不错的选择。至强E5(代号为Romley)带来的提升主要表现在性能和能效上的提升,而这将主要源于它将采用的全新Sandy Bridge微架构。新添的AVX(高级矢量扩展)指令集,以及相对应的较高宽度矢量处理单元就是加速浮点计算密集型应用而生,该技术使用最小的核心面积实现了双倍的浮点吞吐量,之前一代产品,峰值浮点性能可翻一番。

  对于有些需要大内存或共享内存的应用,比如,序列空间、油藏模拟、3D图像渲染等,不适合跑在传统的集群上,而传统的RISC小型机又太贵,则可以使用基于至强7500或至强E7的四路或八路服务器来充当胖节点,或用作单独物小型处理中心。

  对于少量需要高度并行的应用,则可以选择CPU+GPU协同计算的模式,也可以等待2012年英特尔基于集成众核架构(MIC)的50核产品——Knights Corner。跟GPU最大的不同之处在于,MIC由于使用X86内核,从编译器、数学库到整个编程模型非常灵活,现有所有的至强模型同样适合于MIC,软件与应用移植更加容易。【参考:英特尔众核技术受关注 MIC比拼GPU

  David告诉记者,高度并行计算主要是通过多个小的定序执行的计算内核来获得高的整体积聚性能,这类应用特征包括:大量的并行以使用所有的小核,大量的SIMD操作,高密度计算等。目前来看,只有5-15%的应用符合上述特征。他建议用户可以首先为多核CPU优化,然后再考虑向众核进行扩展。

  四、以应用特征分析为基础来优化系统

  了解高性能计算系统的朋友知道,在系统测试与选型过程中,往往要考虑很多指标,包括CPU主频、缓存大小、核的数量、QPI数量与带宽、内存主频与容量、存储和文件系统、网络、加速技术等。而且根据应用不同,对于这些指标可能有不同的侧重,比如有的应用是浮点计算密集型,有的是I/O密集型,有的则需要大内存。

  英特尔数据中心事业部亚太和中国区高性能计算/工作站方案架构师何万青博士在研讨会上谈到,建议用户基于自身的应用需求特征,通过一系列测试工具来对HPC系统进行精细化的研究分析,找到可以调整和优化的部分,然后通过“硬件升级、软件性能调优、应用扩展”等不同方法,来提高系统的整体性能,达到硬件系统与应用之间的平衡。

  比如,针对高向量化的应用,主要关注单个线程的CPI、缓存命中率、浮点计算的向量化比例、内存带宽等因素,需要CPU的内核足够强大,如英特尔的至强处理器;针对大规模多线程并行的应用,主要关心多进程通信、同步、并发度、扩展性等问题,可以通过数量众多的小核来运行,如英特尔的MIC众核产品;而针对I/O密集型应用,需要重点关注的是磁盘写、网络带宽和延迟等指标,可以通过SSD固态存储或万兆以太网技术来优化。【参考:HPC系统优化 按应用特征分析对症下药

  总之,随着应用的发展,对计算规模、数据量、结果的精度与实时性等要求也来越来越高,因此,使得今天的一套高性能计算机要想发挥出最大的效能,需要综合考量与平衡多种因素,弥补相应的短板。在这一点上,产业界与用户已经达成了共识。

0
相关文章