3. 性能分析
3.1. 领域软件分析
现有的事实上的并行标准主要有共享内存和消息传递两种编程模式,因此物理、化学和材料计算领域的应用软件也不外乎这两种编程模式。共享内存编程模式主要是通过内存统一编址来实现数据的传递,Gaussian软件是这方面的代表,也是最常用的软件之一。虽然Gaussian软件可以支持通过Linda的消息传递模式,但是和单一操作系统的运行效率相比性能有所下降。消息传递模式并行编程便于程序的扩展性,也是这个领域主要应用所采用的计算模式。计算材料电子结构的vasp是其中典型的应用软件,在曙光PHPC上的测试也表明该平台的性能不亚于大规模的的机群的性能。
3.2. Gaussian软件
(一) 软件介绍
Gaussian是做半经验计算和从头计算使用最广泛的量子化学软件,可以研究:分子能量和结构,过渡态的能量和结构,化学键以及反应能量,分子轨道,偶极矩和多极矩,原子电荷和电势,振动频率,红外和拉曼光谱,NMR,极化率和超极化率,热力学性质,反应路径。计算可以模拟在气相和溶液中的体系,模拟基态和激发态。
Gaussian 03软件主要采用两种并行方式,主要采用基于OpenMP的并行方式。OpenMP并行方式可以运行在基于共享内存方式或者基于NUMA体系结构的高性能计算机上采用多线程的方式实现高速并行。Gaussian系列软件也引入了面向机群体系结构的,基于Linda并行库来实现多机的并行作业。TCP-Linda是专门为Gaussian03设计,实现G03分布式并行的必需程序。但是由于编程模式的限制,Gaussian03的主要应用模式。
(二) 测试平台
测试在若干常用平台上进行:
1. 曙光PHPC100,5个计算模块,使用Barcelona 2350处理器,主频2.0GHz
2. 曙光A0r-F胖计算节点,8个AMD Opteron8218双核处理器,主频2.6GHz
3. 其他体系结构的结果都是引用于互联网上友商的公开结果
算例采用软件自带的test397的算例,该算例使用密度泛函RB3LYP方法,高斯基展开使用3-21g方式,对由168个原子组成的缬氨霉素,进行过渡态优化,同时计算了布局分布和Mulliken电荷。
(三) 测试结果
(四) 结果分析
1) 在曙光PHPC100上,Gaussian软件具有优异的性能;在两个计算模块的规模上,达到了性能的高点,这是通常用户使用的模式。
2) 2台曙光PHPC100的性能高于2台A0r-F;
3) 曙光PHPC100相对于小型机性能并不差,同时从易用性、应用环境和价格来说,相差非常大;
3.3. Vasp软件
(一) 软件介绍
VASP是一个被广泛应用的基于密度泛函方法的从头算量子力学软件包,可以模拟固体、界面和表面的性质,适用于多种材料体系,包括陶瓷、半导体和金属等。第一原理计算允许科学家研究系统的电子、光学和结构性质的本质和根源,除了系统组成物质的原子序数以外,并不需要任何实验数据。因此,VASP非常适用于解决固体物理、材料科学、化学以及化工领域中的问题,在这些领域的研究中,科学家可以应用计算机进行虚拟实验,从而能大大节省实验的费用并缩短研发周期。VASP是使用赝势和平面波基组,进行从头量子力学分子动力学计算的软件包,它基于CASTEP 1989版使用Fortran90软件开发。
(二) 测试平台
测试在若干常用平台上进行:
4. 曙光PHPC100,5个计算模块,使用Barcelona 2350处理器,主频2.0GHz
5. 曙光A0r-F胖计算节点,8个AMD Opteron8218双核处理器,主频2.6GHz
6. 其他体系结构的结果都是引用于互联网上友商的公开结果
算例使用RMM-DIIS算法对50个汞原子构成的体系进行电子自洽计算测试,长算例使用共轭梯度(conjugate gradient)算法对50个汞原子构成的体系进行结构优化。电子自洽计算和结构优化是计算化学,材料计算,从头计算分子动力学中最为基础的,也是最经常做的计算,而DIIS和共轭梯度算法是使用最广泛,最优秀的全局收敛算法之一,因此算例很具有代表性。DIIS和共轭梯度算法主要的操作是对浮点数值矩阵进行相乘,相加的操作,所以测试主要针对系统的浮点计算性能。
(三) 测试结果
(四) 结果分析
1) 曙光PHPC100计算平台具有出色的浮点计算性能和扩展性;
2) Vasp软件在以太网上的扩展性只有16个核心,这样8个或者16个核心能够达到软件的最大效率;如果希望模拟更大规模的题可以增加InfiniBand模块,或者两个曙光PHPC堆叠;
3) 1套曙光PHPC计算平台完全和相同核数的小型机相比,极大降低了用户的拥有成本 ;