NAMD版本 | CUDA驱动版本 | 测试时间(秒) | ||
NAMD_2.7b3_Linux -x86_64-CUDA | 2.3-drv | 1*C1060 | 2*C1060 | 3*C1060 |
277.630463 | 156.488815 | 128.077164 | ||
3.1-drv | 1*C1060 | 2*C1060 | 3*C1060 | |
407.601776 | 221.654938 | 176.371780 | ||
1*C2050 | 2*C2050 | |||
205.011581 | 129.603073 | |||
NAMD_2.7b2_Linux -x86_64-CUDA | 2.3-drv | 1*C1060 | 2*C1060 | 3*C1060 |
394.606384 | 216.176727 | 174.694672 | ||
3.1-drv | 1*C1060 | 2*C1060 | 3*C1060 | |
534.408508 | 287.990723 | 233.471939 | ||
1*C2050 | 2*C2050 | |||
357.576599 | 210.960190 |
上表中的测试时间均为记录系统运行算例的Wall Clock Time,由上表的数据分析可得出以下结论:
1. 驱动版本对性能的影响
对于相同的软件版本在不同驱动版本情况下的测试时间可知,在NF5588平台上安装cuda2.3驱动较cuda3.1的驱动对于C1060 GPU更适合(如下表),这是因为cuda2.3驱动是在Tesla 10系列的cuda架构下开发的;而Tesla 20系列的“Fermi”架构GPU,则需要 cuda3.1的驱动支持,不存在驱动版本的影响。
▲
2. 软件版本对性能的影响
对比不同版本软件运行时间可知,更高版本的软件性能更优,这也是软件逐步优化版本更替的结果。如下表中的提取数据,说明NF5588在搭载C1060时NAMD_2.7b3的运行时间较NAMD_2.7b2减少25%—30%;在搭载C2050时NAMD_2.7b3的运行时间较NAMD_2.7b2减少38%—43%。
▲
▲
3. 多GPU加速比的分析
如下表,不难看出NF5588对于搭载多GPU的情况下,加速比值都不错。
▲
▲
4. 搭载C2050与C1060的性能对比
分别取两个版本NAMD软件在GPU卡适合的驱动(C1060取2.3driver;C2050取3.1driver)下得到对比图表,及性能对比数据:
▲
对比情况 | 1*GPU | 2*GPU | ||
2.7b3-3.1drv-C2050 VS 2.7b3-2.3drv-C1060 | 2.7b2-3.1drv-C2050 VS 2.7b2-2.3drv-C1060 | 2.7b3-3.1drv-C2050 VS 2.7b3-2.3drv-C1060 | 2.7b2-3.1drv-C2050 VS 2.7b2-2.3drv-C1060 | |
性能提升 | 35.42% | 10.36% | 20.74% | 2.47% |
从测试结果来看, NF5588搭载C2050对比搭载C1060,都有不同程度的提升,最好时能高出35%。但是受软件版本及GPU运行数目的影响,性能提升略有不同。如受软件版本影响,对于2.7b3版本的NAMD_CUDA软件,在C2050对比C1060上的运行性能提升更高,说明新版本软件对C2050新架构的支持更好。