4.性能分析
4.1分析方法
从计算特性上分析,生物计算的类型主要包括两类:
(一)高通量计算(定点计算)
基因序列比对、药物筛选等
计算任务相对独立,进程间无通信或通信量很小,要求充分利用系统的计算资源,使总吞吐量最高
需要较大的内存,较高的数据I/O吞吐量;较强的并发处理能力
(二)高性能计算 (浮点计算)
蛋白质三维结构预测、蛋白质-蛋白质相互作用、基因进化分析、分子动力学计算
利用大量资源共同解决一个任务,使求解时间最短
进程间通信密集,网络性能要求高
为了掌握PHPC100计算平台针对生物计算应用的性能表现,对两个典型应用软件做了性能测试,并和其他计算平台的性能测试结果做了对比。MPIBlast是高通量计算的典型代表,Gromacs是高性能计算的典型代表。
4.2MPIBLAST性能分析
(一)软件介绍
BLAST是现在应用最广泛的序列比对软件,用于基因序列的两两比对,由NCBI研制。MPIBLAST是NCBI BLAST的并行化实现,基于标准MPI并行环境,可以免费下载使用。
MPIBLAST软件的计算特点:
· 定点运算为主;
· 内存需求量大;
· MPI通信比较少,主要是网络文件系统的读写对网络性能有一定要求;
· I/O量比较大;
(二)测试平台
测试在3个平台上进行:
曙光PHPC100,5个计算模块,使用Barcelona 2350处理器,主频2.0GHz
曙光A950r-F胖计算节点,8个AMD Opteron8212双核处理器,主频2.0GHz
IBM P575小型机,8个Power5双核处理器,主频1.9GHz
(三)测试结果
使用MPIBLAST 1.4.0版本;数据库使用month.aa,库所占空间为106MB;查找序列的输入文件为F.joh_aa.fasta,查找1500个序列;
测试结果如下:
(四)结果分析
在曙光PHPC100上,MPIBLAST有着优异的性能表现; 单进程的搜索速度较快;多进程并行搜索时,达到了近乎线性的加速比;
2个节点的PHPC100的性能就高于1台A950r-F;一台曙光PHPC100(39进程)高于IBM P575(8路双核),而价格则大概为其1/5;
4.3GROMACS性能分析
(一)软件介绍
GROMACS是用于研究生物分子体系的分子动力学程序包。它可以用分子动力学、随机动力学或者路径积分方法模拟溶液或晶体中的任意分子,进行分子能量的最小化,分析构象等。GROMACS最初是设计为生物大分子如蛋白质、核酸、脂类等物质的计算、分析服务的。由于其在非成键作用力的互相作用方面具有极强的计算能力,很多研究机构也用其来计算、研究非生物的大分子系统,如聚合体等。
GROMACS是开源软件,最初由荷兰的Groningen大学的Department of Biophysical Chemistry开发。可以免费使用,有基于MPI的并行版本。
并行GROMACS软件的计算特点:
· 计算密集型的程序,浮点运算量很大;
· GROMACS程序对内存的要求很小;
· MPI通信频繁,对互联网络性能要求高;
· I/O量一般,在REMD模式下稍大
(二)测试平台
测试在3个平台上进行:
曙光PHPC100,5个计算模块,使用Barcelona 2350处理器,主频2.0GHz
SUN4600胖计算节点,8个AMD Opteron8214双核处理器,主频2.2GHz
IBM P575小型机,8个Power5双核处理器,主频1.9GHz
(三)测试结果
GROMACS使用源代码编译,版本为GROMACS-3.3.1;fftw为使用源代码编译,版本为fftw-3.0.1;测试中采用默认优化参数。使用gcc编译器,测试算例为gmxbench中的d.dppc,原子数目为121856,模式10ps;
数据为程序运行最后输出的real time,单位为s;
结果分析
· 曙光PSC平台发挥了出色的浮点计算性能;
· 1套曙光PSC的性能为1台SUN 4600(8路双核)的3倍;
· 1套曙光PSC的性能优于1台IBM P575;
案例分析
曙光服务器用户体验中心成为PHPC100计算机在生物领域的第一个用户。
曙光服务器体验中心是综合性的用户体验平台,许多生物计算的用户在体验中心做应用软件的性能测试。PHPC100部署到体验中心后,作为生物计算平台达到了很好的效果。系统部署简单,放置在值班区的办公环境使用,经过多项测试的验证,PHPC100计算机性能出色。