服务器 频道

张云泉:解读中国超算发展现状与趋势

  【IT168 专稿】2012年9月18-21日,首届曙光超算技术大会(SSC 12,Sugon Supercomputing Conference 2012)在北京曙光公司总部盛大召开。本届大会面向广大从事与高性能计算应用、超级计算系统维护和应用相关的科研院所及高校老师、硕博研究生及相关企业工程师、从事高性能计算工作的技术人员,邀请重量级嘉宾,以及业界知名专家、以及Intel、Mellanox、Nvidia等知名厂商的技术专家等担任主讲教师,为与会学员奉献国内高性能计算培训的饕餮盛宴,帮助了解高性能领域的前沿技术,以及如何管理、使用、优化高性能集群。

  中国科学院软件研究所并行软件与计算科学实验室执行主任,中国计算机协会高专委秘书长张云泉博士SSC大会现场接受了IT168编辑独家采访。张云泉博士深入介绍了中国超算发展现状,同时也指出中国超算持续发展存在的问题与瓶颈,此外,就今年6月份Top 500超算排行榜中体现的超算领域最新技术与应用趋势也做了深入的阐述。

张云泉:解读中国超算发展现状与趋势
▲中国科学院软件研究所并行软件与计算科学实验室执行主任,中国计算机协会高专委秘书长张云泉博士

  张云泉博士谈到:尽管当前世界经济走向还处于不明朗的发展态势,然而我们看到欧美国家仍然持续的投入巨资发展超级计算机。其原因在于,超算与国民经济、工业企业创新、国防科技、国家安全等民生国计的方方面面都息息相关。整体而言,我国超算领域正处于高速发展的上升阶段,汽车制造、航天、发动机、地质勘探等各个行业已经开始广泛使用超算技术,通过超算设计、改善国产企业的产品模型。

  此外,张云泉博士也谈到中国超算产业投入软硬件失衡、人才紧缺等行业性发展瓶颈,张云泉认为,超算是一个交叉学科,由计算机科学、计算数学、行业应用领域应用知识三方面构成,在计算机科学人才教育方面还需要加大投入,并注重跨学科领域的人才培育工作。

  实际上,在国外,企业在整体科技创新方面已经发挥了重要的作用,而此前,我国往往是科研单位带动企业的研发模式,往往由科研单位主导研发项目,再由企业推向市场,因而在研发成果市场化方面出现一些问题。张云泉博士认为如今,国内的企业已经完全有能力、有意愿、并存在现实的研发需求,完全能够找出科研议题和国内科研机构进行合作,尤其一些先锋企业,完全有能力把科研成果用好,并转化为竞争力。

  而谈到超算领域最新的技术发展趋势,张云泉就云计算、大数据、GPU、MIC以及固态硬盘等技术趋势都展开了深入的阐述。谈到对本届SSC大会的期待,张云泉博士表示:我们很高兴看到国内企业开始举办技术交流大会,这是一个很好的尝试。我们希望曙光超算技术大会也能做成每年几千人的技术盛会,给大家提供交流的舞台,帮助曙光公司在市场上占领一定份额,高专委愿意对曙光超算技术大会提供支持。

  完整访谈记录如下。

${PageNumber}

  IT168编辑:请先介绍一下目前中国超算发展的现状?

  张云泉:现在超算发展态势很好,虽然世界经济危机,但是我们看到最新世界Top五百中,前十名的机器欧洲占五台。这些国家已经深陷经济危机但仍然投入巨资发展超算,超算对一个国家创新的重要性不言而喻。我们原以为在经济危机的压力下,这些国家会缩减一些超算的预算,但实际情况是这些国家的预算非但没有减少反而增加。

  美国红杉刚刚在六月份重新夺走世界靠前的位置,可见Top500世界靠前的位置依然竞争激烈。总体来看超算竞争仍然激烈,创新路线仍然重要。我们国家在天河以及星云取得第一第二之后,在国内超算领域掀起更高的热潮,尽管第一的位置已经被欧美国家夺回,但是Top500的排名对超算普及仍然有很大的贡献。

  超算发展态势良好的同时也引起我们一些新的思考,比如我们在超算领域投入软硬失衡的问题,我们在硬件领域投入多而软件欠缺,同时包括人才欠缺的问题。都比较早地曝露出来,也是我们要应对的一些问题。

  整体而言,我国超算领域正处于高速发展的上升阶段,未来前景十分看好。因为超算和国家的创新能力、综合国力直接相关,对国家转型发展有重要意义。国家需要转型发展,首先是需要中国创造,其中很大的部分要依赖计算科学。基于超算的计算科学、计算模拟的设计、模拟、优化,对工业界提高竞争力有很大的帮助,所以很多企业和单位都在持续投入。

  IT168编辑:刚刚您提到我们国家在超算排行榜上也取得了一些很好的成绩,这对我国超算意味着什么?

  张云泉:首先是我国超算地位的提升。我国超算系统取得第一第二前几名的成绩,意味着中国超算整体水平提升,在国际舞台上发言权也随之提升,机会也越来越多,对于提升国内科研水平、培养科研队伍,包括参与国际标准的制订都有很好的帮助,这是我们在第一线国际会议上很强烈的感受。由此焕发出爱国心,知道祖国强大对自己的重要性。

  超算Top 500不仅仅是位置问题,而是意味着整个国家的科研人员和队伍在国际上的地位、座次,直接关系到相关政策上的问题,所以还是要重视排行榜,我们不是追求,但是要重视。讲述一个具体的小故事,2011年日本“京”夺天河一号位置的时候,日本国内去了80多个参会代表,拿着录像机进入会场,我们感觉竞争的激烈,也感觉到日本对超算的重视。美国也很重视超算排名,一旦失去第一位置,就会投资多个科研项目,确保能够把第一夺回来。这说明竞争不是很简单的位次的问题。

  另外还有对超算普及的科普意义,超算采用的计算机技术是计算机技术的火车头,最新技术一般都最先在超算采用,成功后才会普及到个人计算机上,所以对技术的推动作用毋庸置疑。

  另外超算对于创新的贡献也十分重要,越来越多企业发现服务器、包括采购CAE软件投入自己的产品设计和研发领域,提高产品竞争力,并降低成本。每年出席中国CE年会、服务年会,会看到很多汽车制造、航天、发动机、地质勘探等各个行业已经广泛使用超算技术,而且设计出中国自己的产品。大家也看到很多国产产品外观、实用性方面的改善,越来越好看、越来越人性化,其中很大部分得益于朝算对于工业制造设计的支持,可以更快研究方案、把产品推向市场。我们其实更重要看重工业创新的支持。

  最后,超算水平的高低意味着一个国家的综合实力,尤其体现在国防军工上,比如核武器都要靠朝算模拟,核禁试会禁止所有地下核实验,只能用超级计算机模拟,如果没有这个能力意味着核武器的落后,落后就要挨打。最近的钓鱼岛事件应该让我们深切地感受到国防的重要性。

  超算对于国家安全也意义重大。情报获取是超算的重要应用之一,世界上最大的机器都在进行各种情报的破译和获取,最大的计算型力量都消耗在这里,对于国家掌握先机,取得主动地位是极为重要的,这也是为什么一个国家的超算如果取得世界靠前会对另外一个国家形成威胁的根本所在。

  IT168编辑:超算不是一个独立行业、更多和整个国民经济、国家的科研水平紧密联系在一起。由此产生很多交叉学科的问题。我国超算目前在应用软件上还存在一些弱项。可能产生的原因在哪里?我们可以从哪些方面尽量改进?

  张云泉:超算是一个交叉学科,由计算机科学、计算数学、行业应用领域应用知识三方面构成,对人才要求非常高,尽量掌握三个领域的知识,才能把一件事情做好,开发出对一个领域有用的超级计算应用软件,这个事情对一个人来说很难达到。往往很多人掌握一个方面,最多掌握两个方面已经很了不起了,能够掌握三个方面知识的人及其稀缺,带来合适人才的稀缺,大部分人只能满足部分要求。

  所以软件开发,工程推进都受到很大的影响,需要的资金也相应提高,开发周期也很长。现在的问题是要重视计算科学方向,我们呼吁专门设立计算科学方向研究中心、研究所、专业。从培养人才之初,就让他能够跨多个领域。这是解决短板重要的办法,也是我们多年、多次向中科院领导、国务院领导写报告提出的意见。我们多次呼吁国家重视对计算科学的投入,在大学开设计算科学专业课,包括我们高专委一直很重视教育,今年年会在会上专门开辟教育论坛,请全国高校老师交流经验互相提高,能够在本科生阶段让学生掌握基本知识,为他们在研究生阶段向更高层次提升打好基础。我们看到整个人才培养的问题,正是我们现在急缺的。

  本届曙光超算技术大会内容丰富,涉及到很多很多一线的、直接动手的知识。对于超算普及、让更多人掌握计算科学是一个迫切问题,曙光这次活动抓住了要害,我希望他们坚持一届一届办下去,我们高专委愿意支持这个活动,让它越办越大。

  IT168编辑:所以超算领域的人才培育是一个任重道远的过程,中间各个企业组织需要有很多培训和推广,国家也需要一定的方针和政策作指导。谈到人才问题,我们看到国外超算研发体系当中企业起到很重大的推动作用,比如一个汽车企业有可能会赞助某个大学进行科学研究,而且他们之间的成果是可以应用到企业,这种互动在中国有没有可能实现?

  张云泉:这个问题非常好,也是我一直思考的问题。我们一直说产学研、通过科学研究带动产业化,这个提法不对,往往会形成以研究所为主体的研发模式,研究所先发起研究一个项目,再由企业推向市场,往往会导致失败结果。

  我们现在强调创新的主体是企业,暂时先不谈时机对不对,但是提法是很对的,国外的创新主体一直是企业,企业给科研机构提需求、提出面临的问题,研究出来再回馈再应用。这是一个良性的循环。而不是中国研究员研究一些问题,硬塞给企业去做。需要理顺先后的关系。其实我们科研机构并不是没有科研能力,只是研究的问题方向不够好。例如我们和国外企业合作就很好。我们过去和一些国际企业合作研究,例如我们给AMD开发的新产品即将十月份上市。

  关键是企业在过去,没有到达主动创新的阶段。创新实力不够,只能引进消化吸收国外产品去卖,所以提不出问题、也缺乏意愿、更没有经费让科研机构配合创新。今天我们看到很多国营企业、民营企业市场已经国际化,并有很多经费投入研发,面临的问题也是前所未有的,给企业带来很多创新的难题。我认为今天企业已经有实力、有意愿、并有需求,完全能够找出问题和国内科研机构合作进行产品研发、难题研发,我相信大家如果都能够遵守规则一定能够把这件事情做好,尤其是一些先锋企业,完全有能力把科研成果用好,并转化为竞争力。

  IT168编辑:所以超算发展不仅仅是科研机构面临的任务,和企业创新能力也是密切相关的。

${PageNumber}

  IT168编辑:有哪些趋势影响到超算的发展?

  张云泉:超算领域目前涌现出一些新的趋势。其中包括云计算。云计算本身非常热,广受关注,也很容易让大家引起混淆。其实超算和云计算两者是不一样的,超算可以为云计算提供强大的处理能力、并行计算能力,如果云计算离开超算的支持就无法及时反馈和处理用户需求,所以不能把云计算和超算混为一谈。

  但是云计算可以让超算更加普及,普通用户可以无处不在访问超算计算能力、感受超算魅力,而且可以很好地释放超算巨大的计算能力,对超算的普及、应用、提高效率都很好的,两者相辅相成。但是绝对不能说云计算能够取代超算。

  另外一个重要趋势是海量数据、大数据的发展。大数据需要强大的处理能力,才能从数据里挖掘出有价值的结果和知识。过去超算设计理念是超高的计算性能,但是对吞吐能力、处理能力是较为欠缺的,所以超算如何在架构上重新设计,面向大数据处理应用特征进行优化,也是超算面临的挑战和问题,目前很多研究机构都在考虑如何重新设计体系架构、包括发展新的体系架构。

  此外GPU、众核为代表的异构计算也在蓬勃发展。过去大家对GPU还存有疑虑,现在看来,经过算法设计人员以及体系架构人员共同努力,GPU适合的应用领域越来越广,很多算法成功移植到GPU上,发挥强大的计算能力。同时,GPU架构不断根据应用、计算的反馈进行改进,以适应应用算法的需求。这样双向的互动导致GPU性能越来越好、架构、可移植性、用户支持越来越友好。现在看来GPU已经不是过去的状态了,已经和超算需求深度嵌套在一起。另外英特尔公司也即将发布众核架构,这些架构都有很大的改进,我们期待尽快投入市场,为用户计算提供新的高速引擎。

  IT168编辑:您提到云计算、大数据、GPU和MIC众核,还有哪些技术让您印象深刻?

  张云泉:最近接触比较多是固态硬盘技术,今天要面临大数据挑战,IO能力也非常重要的,固态硬盘不同于传统硬盘,能够通过闪存颗粒来重新设计硬盘体系架构,构架全新产品,解决固态硬盘寿命短、读写能力不对称的问题,让我感到很震惊,我觉得这类产品也会改变超算应用的形态,目前固态硬盘价格还比较贵,还需要时间去推广。我相信新技术出现终归要取代旧技术。

  另外一个让我感到比较重要的是最新的五百强排行榜上,在超算领域应用领域,InfiniBand已经超越以太网成为第一份额的网络连接技术,中国一百强也有很多系统中采用了Infiniband,InfiniBand价格不断在降低,拥有很多业内标准的支持,在超算应用中有广阔的前景。

  IT168编辑:每年全球超算五百强发布大家都非常关注,今年五百强前三名都是Risc架构的机器,刚刚我们谈到超算发展需要更加标准化的架构,您如何看待这个问题?

  张云泉:这是一个新的发展方向,现在来看,GPU前一段时间发展较快,大家在应用GPU的探索过程中发现很多问题,发现GPU的长处和短处,当然我对GPU仍旧看好,GPU的架构也在不断改进中,频率也不断更新。

  有些公司坚持用Risc处理器构架超算系统,像今年TOP 500业内知名的超级计算机,IBM 红杉的处理器核数达到160万,数量极大,功耗在控制范围内,但是对编程造成了极其大的挑战。当然GPU也存在很大的编程问题。对超算来说,首要的问题就是应用编程,几百万的核心如何用好,不同厂家技术积累不一样、长处不一样,采取了不同技术路线去实现。

  国际上希望2018年实现百亿亿级超算,目标是一致的,但是仍然存在很多障碍。用过去不太看好的Risc处理器搭载未来百亿亿级超算,似乎也存在一些可行性。但是目前来看最有可能还是GPU,Risc处理器方面我们可以乐观其成。

  IT168编辑:我们今天探讨了很多关于超算的话题,请问您对本届曙光超算技术大会SSC12有何期待?

  张云泉:这样的大会是我最愿意看到的,我每年都会出席很多国际大企业的会议,经常会去做报告、去参观,这些会议规模很大,厂商会在会场发布产品,宣传自己的理念和新的成果、表彰有贡献的人士,内容非常丰富。

  我们很高兴看到国内企业开始举办这种技术大会,虽然第一届人数并不是很多,但会是一个很好的尝试,正如我刚才所说的,已经到了这个阶段,完全可以做一些和国际企业类似的事情。我们希望曙光超算技术大会也能做成每年几千人的技术盛会,给大家提供交流的舞台,帮助曙光公司在市场上占领一定份额,我祝愿大会越办越好。我们高专委在这过程中愿意提供支持。

  IT168编辑:感谢张云泉博士,从您的问题的回答可以看出这次大会适逢其时,将会有力的促进中国超算行业发展,感谢各位网友,再见!

0
相关文章