5. pi_example (圆周率计算)
π的计算是经典的数值计算算例之一,此算例利用的是Monte-Carlo算法进行计算。
测试结果:在上面的表格中,列出了π的计算算例分别在1U服务器上和“倚天”上的计算时间,可以看出,利用“倚天”进行π的计算相对1U服务器的计算性能提升了约25倍 。因此“倚天”不仅在与图形相关的应用上性能优越,同样在数值计算方面也要比主流配置的X86架构服务器更胜一筹。
6. fft_example (傅里叶变换)
测试结果:如图9所示为1U服务器进行傅里叶变换的结果曲线,表示随矩阵规模的增大,计算时间也随之增加,在矩阵规模为1000时的计算时间约为15毫秒。如图10所示为在“倚天”上进行傅里叶变换的结果曲线,其中红线为基于“倚天”CPU的运行时间曲线,绿线为基于“倚天”GPU的运行时间曲线,蓝线即为相应的矩阵规模下“倚天”GPU相对于“倚天”CPU的加速比曲线。从结果显示,在矩阵规模为1000阶时,“倚天”GPU的运行时间仅为1毫秒,相比1U服务器性能提高了15倍之多。
并且我们很容易发现,随着矩阵规模的增大,“倚天”GPU计算的优势变得更加明显,相对于CPU的加速比一直处于增加的趋势。
7. blas_example (线性代数运算)
测试结果:如图11所示为1U服务器进行线性代数运算的结果曲线,表示随矩阵规模的增大,计算时间也随之增加,在矩阵规模为2000时的计算时间约为140毫秒。
如图12所示为在“倚天”上进行线性代数运算的结果曲线,其中红线为基于“倚天”CPU的运行时间曲线,绿线为基于“倚天”GPU的运行时间曲线,蓝线即为相应的矩阵规模下“倚天”GPU相对于“倚天”CPU的加速比曲线。从结果显示,在矩阵规模为2000阶时,“倚天”GPU的运行时间仅为50毫秒,相比1U服务器性能提高了2.8倍。
可以看到,同傅里叶变换的测试类似,随着矩阵规模的增大,利用GPU进行线性代数运算的优势更加明显,相对于CPU的加速比一直处于上升的趋势。