【IT168 专稿】2012年9月18-21日,首届曙光超算技术大会(SSC 12,Sugon Supercomputing Conference 2012)在北京曙光公司总部盛大召开。本届大会面向广大从事与高性能计算应用、超级计算系统维护和应用相关的科研院所及高校老师、硕博研究生及相关企业工程师、从事高性能计算工作的技术人员,邀请重量级嘉宾,以及业界知名专家、以及Intel、Mellanox、Nvidia等知名厂商的技术专家等担任主讲教师,为与会学员奉献国内高性能计算培训的饕餮盛宴,帮助了解高性能领域的前沿技术,以及如何管理、使用、优化高性能集群。
曙光信息产业股份有限公司解决方案中心总经理曹振南在会后接受了IT168服务器频道的专访。他指出,目前我国高性能计算产业在硬件方面已经进入世界前列,但软件和应用与欧美相比还存在明显的差距,而其中人才缺乏是制约产业进一步向前发展的最大障碍,这正是曙光举办这次超算技术大会的初衷。
他在访谈中还提出,由于高性能计算本身的特殊性,使得这个领域往往会最先采用一些顶尖的先进技术,这些技术随着时代的发展,也会进一步下移到其他行业领域,比如网格、分布式等技术在云计算、大数据处理等新兴领域的应用,而这也为曙光近两年开始从高性能计算向云计算领域进一步拓展打下了基础。
IT168:据我了解,在国外,类似的超算大会已经举办很多年了。曙光超算技术大会是第一次,也带有很强的技术培训性质,包括“管理、开发和优化”三大方面,讲的内容很多都是干货。曙光为什么选择这个时候来举办这样一个大会?
曹振南:最近几年,在包括曙光最内的企业、科研院研的努力之下,中国在高性能计算技术方面有了很大的发展,特别是在高性能计算机的硬件方面,国内的差距与国外越拉越小,其实目前中国高性能计算机硬件已经走到了世界前列,踏入第一阵营。
但是,也要清醒地看到,我们在软件、应用和其他方面与国外相比还存在明显的差距。所以我们选择在这个时候举办这样的培训大会,最主要的一个目的就是要帮助国内从事高性能计算的技术人员更深刻地了解相关技术,在软件和应用方面有更进一步的提高,从而促进中国高性能计算产业的发展。
从会议内容看,很多都是“干货”,我们并不是宣传曙光的产品,更多是从技术的角度来帮助大家更有效地管理和使用计算机,更高效地开发和优化高性能计算软件,让管理员更好地使用高性能计算机。
IT168:确实如此,无论是曙光星云、天河一号,都已经进入了全球高性能计算机TOP500排行榜的前十,但应用一直是国内HPC产业发展的一个瓶颈,目前国内应用的障碍体现在哪些方面?
曹振南:我个人觉得最大的障碍是人才缺乏。目前国内高性能计算的需求越来越大,特别是随着自主创新和科技发展,越来越多的用户单位想拥有自己的高性能计算机,能用上高性能计算机,但很多用户也同时发现,买起来容易,用起来难,要想用好、用出特色就更难了,因为没有会高性能计算的人才。当然,中国在高性能计算领域起步也比较晚,国内更多是在谈硬件,谈应用和软件相对少,各种培训也比较少。曙光作为高性能计算的领导企业,我们有能力做这样的事,以后我们每年都会举办这样的培训,帮助各行各业培养更多的高性能计算人才。
IT168:那么,这次超算大会具体会起到什么样的作用呢?
曹振南:举一个例子,我们有一个很重要的主题是并行应用软件开发,就是告诉大家如何使用MPI和OPENMP,从结构上设计和开发相应的软件。当然,一两次培训还是不够的,后期我们会通过网站提供更多的资料,现在是想让开发人员能先入门,知道应该从哪些方面去做,去学习,以后会提供更多机会让大家深入去研究这些技术。
IT168:高性能计算一直是曙光公司的优势业务,国内许多超算中心、高性能计算中心都是曙光公司帮忙建立起来的。但我们也看到,曙光近两年开始发力云计算领域,比如“城市云”。那么,我想问的是,曙光在高性能计算领域里的运作经验对于你们开拓云计算市场有哪些帮助?
曹振南:帮助还是挺大的,主要体现在两个方面:首先是相关产品技术的研发方面。我们知道高性能计算已经发展几十年了,有很多通用的技术,包括今天一些个人电脑上的技术最早都是用在高性能计算机上,比如今天的电脑,甚至手机都已经是多核的,其中就用到了并行计算的技术。这是因为高性能计算本身比较高端,必须要使用更先进的技术,而这些技术会逐渐下移。我们在高性能计算领域多年的技术研发积累能够帮助我们在云计算市场上快速研制出相应的产品和方案。
其次,曙光帮助大量的用户构建和运营高性能计算中心,这些运维经验对于我们建云计算中心也有很大帮助,虽然这两者也存在一些区别。比如今天我们已经在成都、无锡、包头、南京等地建立了多个云计算中心。
IT168:对于高性能计算能否通过云的方式来实现,业界也存在一些不同的声音,有支持的,也有不太认同的。但我们也确实看到有超算云、渲染云这样的一些方案出现,也有人在利用亚马逊云计算资源在做HPC的事,请问曙光是如何看待这个问题?当前HPC云在国内的使用情况如何?
曹振南:从云计算资源的获取方式来看,强调快速、动态、按需付费,这些理念其实与高性能计算相似,比如在高性能计算领域有一种网格计算的模式,也是强调“看不到资源,但能按需使用资源”。所以我们反观云计算的发展过程,你会发现云计算正是在网格、分布式、虚拟化这些技术上发展起来的,而其中许多技术与高性能计算可以说是一脉相承。
今天一些传统的超级计算中心,比如上海超算,已经具备了云计算的一部分特征,如动态获取资源、动态分布式计算等,另外我们现在新建的高性能计算中心也在往云方向更迈进一步。相信随着云计算的成熟与发展,有助于高性能计算的平民化普及,因为从资源交付上看,可以让大家在获取高性能计算资源时更加容易,门槛进一步降低。
IT168:传统上,高性能计算在科学计算、工程计算、生物计算领域用得比较多,但今天互联网经济发展很快,特别是移动互联网、社交媒体、电子商务发展很迅速,针对这些新兴的应用,高性能计算有哪些用武之地?或者说,有哪些相关的技术是可以移植到这些新应用上面去?
曹振南:高性能计算是很多技术的鼻祖,为了满足高性能计算的需求,最顶尖的网络、计算、存储技术会用到这个领域,然后下移到其他领域。同时我们也看到,随着云计算、物联网的发展,数据量、计算量会越来越大,很多地方不得不依赖于高性能计算。比如医疗行业以前可能IT主要用于OA信息化等应用,但随着影像数据越来越多,就需要用到并行计算、大数据处理分析等技术。
IT168:在高性能计算领域,这种大数据的处理分析应用是不是也越来越明显?曙光有没有相应的解决方案?
曹振南:高性能计算可能是最早碰到大数据这个问题的,因为它本身就是要处理海量的数据。现在许多行业都碰到大数据的问题,高性能计算里的并行文件系统、分布式存储这类技术就会下移。
具体到曙光来看,得益于我们长期在高性能计算和网络安全领域里的技术积累,我们很早就涉及到了大数据,第一代的产品早在两年前就已经发布。预计明年,我们还会针对结构化数据和非结构化数据的结合体X-DATA,会发布新一代的产品。
IT168:最后,想请你结合曙光公司自身的产品方案,以及这次超算技术大会,总结一下当前有哪些值得关注的高性能计算领域的发展趋势?
曹振南:主要有四点值得关注:一是高性能计算的平民化,进一步降低门槛,这是包括曙光在内的许多从业人员追求的目标;二是高性能计算部件的非通用化,虽然通用CPU发展很快,但还是很难满足高性能计算应用的需求,所以需要一些半通用、半专用的技术,比如GPU、众核等;三是高性能计算使用起来要更简单、更容易,像CheckPoint、管理方面的技术会有大发展;四是高性能计算应用本身的规模会越来越大,要求也越来越高。