【IT168 调查报告】虽然在公有云市场亚马逊的AWS一骑绝尘,将微软、IBM、谷歌等竞争对手甩在身后;但在新的战场,微软Azure却在超越AWS。
在近日,arXiv.org上发布了一项新研究,用高性能Linpack对云计算供应商的比较基准测试中;微软的Azure击败了亚马逊的AWS、Rackspace、IBM SoftLayer和美国NERSC(国家能源研究科学计算机中心)的Edison超级计算机。
该研究报告还同时指出,在公有云上的单个计算核心性能可以与传统的超算系统比较。报告的两位作者来自Exabyte的Mohammad Mohammadi和Timur Bazhirovused表示,“对于传统需要大型和成本密集型硬件采购的高性能计算工作负载,云计算的可行性和优势仍然存在争议,特别是需要分布式内存的软件应用程序是否可在云基础架构上运行。”
他们强调,“用高性能Linpack测试基准对公有云提供商的非常好的可用计算硬件的性能进行评估。同时我们优化了每个计算环境的基准,并评估了分布式内存计算的相对性能。发现微软Azure胜出,并表明公有云上的单个计算核心的性能与现代传统超级计算系统相当。”
这一结论证明,微软Azure的云计算框架在高性能计算任务方面有着显著优势。同时报告认为,在云中使用高性能计算已经就绪,并且可以为资本密集型本地硬件部署提供可行的,具有成本效益的替代方案。
位于旧金山的模拟和建模公司Exabyte针对Linpack测试套件标准开发了四个基于云的HPC服务和一个超级计算系统。研究人员Mohammad Mohammadi和Timur Bazhirovused使用高性能Linkpack套件(HPL)进行研究,试图在分布式存储计算平台上使用64位算法在集中矩阵中解析随机数的线性方程。HPL与主机系统缩放,确保在并行效率等方面具有可比性。
▲如图:表中列出了参加测试所采用的实例,内核数量,处理频率,内存大小,以及带宽。
Exabyte测试了AWS的三种不同选项,hyper-threaded,non-hyper-threaded和non-hyper-threaded with placement groups;在Azure上使用了三种实例模型,F系列、A系列和H系列;在在Rackspace上使用Compute1-60实例;IBM的虚拟服务器实例;同时也在NERSC Edison的超级计算机上运行,并启用超线程,作为非等效比较,Edison为Cray XC30,具有2.57 petaflops的峰值性能,拥有133284个核心,357兆字节内存,7.56PB硬盘,在当前全球TOP500排名60。
▲如图,所有基准案例的加速比Speedup(最大加速Rmax与峰值加速Rpeak之比)与节点数的比值。对1、2、4、8、16和32个节点的加速比进行调查并给出分数。
在测试显现中,Azure A实例(AZ-IB-A)表现了更好的整体扩展,最大32节点是单个节点加速比(Speedup)的28.94倍。比AWS所测试三个实例中,表现最为高的AWS-NHT-PG实例的加速比17.18倍,高出不少;Rackspace的Compute1-60实例,最大32节点是单个节点加速比的18.55倍,高于AWS-NHT-PG实例;NERSC Edison的加速比为27.17。
▲如图:AWS-NHT-PG实例(AWS non-hyper-threaded with placement groups)
综上,研究人员认为AWS有拓展性的瓶颈,性能随着添加到计算池中节点数量的增加而降低。Rackspace与AWS相比,其数据中心的拓扑结构使其性能得到了提升,而高于AWS的表现;虽然Rackspace高于AWS,但研究也指出,随着节点的增加,二者都有显著的并行性能下降;规模的网络饱和度较慢的处理器时钟速度影响了IBM Softlayer的性能。