服务器 频道

发现暗物质 浪潮高性能助力SKA望远镜

  【IT168 评论】 9月26日,2014高性能计算用户大会在京举行,近千位国内外高性能计算研究与应用专家和用户代表到会。大会提出“HPC PLUS”理念,认为高性能计算正在联接世界、改变生活,并展示了高性能计算在全球最大射电望远镜阵列SKA项目、政府间气候变化委员会IPCC-AR5、天河二号超大规模应用等大科学工程中的最新进展,分享了深度学习、个体医疗以及脑科学等全球热点技术领域的高性能计算应用趋势。会后,浪潮邀请了奥克兰理工大学研究创新试验室商业研究经理JohnBancroft参与采访,具体速记如下。

  问:为什么SKA选择了浪潮?

  John Bancroft:浪潮是SKA里边唯一的一个正式的参与公司,SKA里边有许多非官方的参与公司,但浪潮是世界上其中唯一一个正式的参与公司。浪潮共同参与建设了天河二,这是一个非常好的说明。SKA将会采用不同的计算架构,像至强系列CPU,还有至强5之类的产品,这些产品基于英特尔,然后浪潮和英特尔有着很好的合作关系。

  问:现在SKA和浪潮之间的合作有什么样的经验?还有哪些国家参与了SKA项目?

  John Bancroft:114个国家,然后17个联盟参与SKA。

  问:现在的浪潮是一个什么样的阶段?

  John Bancroft:浪潮是计算平台的参与者,SKA计算平台任务的参与者。计算平台任务属于科学数据处理整个大任务的一个部分,一个很重要的部分。

  问:我记得以前NASA也有一个类似于是用我们自己的个人去参与宇宙的这个监听环境,那么SKA和那个NASA项目有什么不一样?

  吴韶华:NASA的这个项目和SKA是完全两个不同的项目,SKA领导主要是英国在做领导,目前据我所知,好像NASA他们并不参与。

  问:美国参与了,但是NASA没有参与。

  吴韶华:美国也没有参与。

  问:美国是没有参与SKA项目的?

  吴韶华:对。

  John Bancroft:是这样,美国在八年前决定不参加SKA,但是就是美国里边有些研究机构,他们和SKA里边的一些大学有合作关系,他们是通过这样的形式来参与SKA,就像John来自的AUT大学。浪潮是中国的一家公司,中国是SKA很重要的一个成员,这也就是为什么浪潮是SKA的一个原因之一。

  问:SKA目前研究有什么样实质性的进展或者说结果吗?

  John Bancroft:首先是有很多工作,要对于在天文学里边应用的算法来进行研究,目前很多工作都在上面做。

  问:是算法?

  John Bancroft:对对,一方面是算法。另外还有软件,目前最重要的工作是确定各个部分到底应该怎么来做,就比如说我计算平台要采用什么样的设备,如何来进行设计,因为大家知道SKA它是一个需要非常非常庞大计算量的这样一个构成项目,然后它在比如说除了计算平台,还有互联网方面,有很多的工作要去做,现在正在进行前期的设计。

  我们现在是在测试不同的方案的性能,来尝试发现非常好的的一个选择。就像对于计算平台来说的话,我们目前正在测试,我们是不是要用GPU,是不是要用MP+,还有麦克。

  问:那么(英语)。我至少两个还是两个集群,是什么样的?

  吴韶华:应该是有两个吧。

  问:两个,两个天文望远镜参与,参加的这个项目?

  吴韶华:对对。

  问:(英文)。

  吴韶华:NO,我们现在并没有确定要用天河来搜集这个数据。

  John Bancroft:有两种方案,第一种就是通过网络传输,这应该是一种几乎是不可能实现的这样一种方式。另一种就是通过传运的方式,来把硬盘,用硬盘来拷到数据之后用来传达应用,是这样。也许还有另外一种方式,就是我们先把数据压缩之后然后上传到云中心,然后通过云中心在世界上不同的国家来下载数据。

  问:这么说的原因就是因为数据量太大了,以至于用传统网络传输不可能的。

  吴韶华:对,所以完全不可能的,因为他说的第一种是我们新铺一条,这个造价实在太大了。

  问:那这样说它的计算的分析仍然可能会在中国进行,还是说会分布式的在全国各地?

  John Bancroft:是这样,现在SKA有两个主要的望远镜阵地,一个位于南非,一个位于澳大利亚,然后由南非产生的数据主要放在南非来进行处理,由澳大利亚产生的数据主要放在澳大利亚来进行处理,它是这样分开处理的,在南非和澳大利亚将分别有两个独立的数据中心,南非有可能是位于开普敦,澳大利亚有可能位于波斯附近。

  是这样,那个数据处理完全之后,将会产生图像,这些图像是非常重要的图像,这些图像再会提供给许多的天文学家来做研究。

  问:那么南非或者澳大利亚的数据,是不是会由浪潮来做一些工作,因为这样的话会有一步平衡,就是设定望远镜多的国家有可能处理能力不足。

  John Bancroft:我们是有机会的,我们是有机会的。我们有很大的机会来参与这两个建设,因为这些建设它是由不同的人来负责的,就比如说现在SKA有科学数据处理联盟,有中央信号处理联盟,有很多不同的联盟,因为SKA的建设有很多,所以这些联盟也有很多,然后不同的联盟都有不同的工作来做,但是他认为我们在计算平台这块的话是很有机会。

  问:他说如果说中国能够提供在计算,在混合架构方面有更好的性能的话,那么这也是一个很好的机会。

  John Bancroft:他们来选择的时候会根据最好的性能来选择。

  问:(英语)。

  John Bancroft:他认为每一个国家的联盟其实是基于望远镜或者说天文学家而建立的,而不是说基于数据中心来建立的。就是说关于这些数据中心吧,现在大家并没有达成一个一致的意见,因为数据中心仅仅是用来做一些数据的处理的,而SKA他其实关注的是天文学的研究,然后数据中心只要有数据他就可以来用了。因为我们浪潮是在做数据上面有很多的经验,我们参与SKA也很久了。

  因为是这样,SKA的数据需要多少个数据中心,是基于它有多大的数据量,它有多高的计算需求,是基于这样来建数据中心的。基本上我们目前是就SKA来说的话,目前有两个大的数据中心,一个位于南非的开普敦,另外一个位于澳大利亚的波斯,然后同时各个SKA的参与国会建立自己的数据中心,这个数据中心有可能就是一个了,然后每个国家都会有一个自己独立的数据中心来处理,就像刚才John所说的通过传运过来的数据。

  现在SKA,实际上很多相关法定的条款它并不完善,现在有很多的协商需要去做,和各个成员国以及SKA官方来做。

  问:他说的不是法律,他说的是政治上的沟通。

  吴韶华:对对对。

  John Bancroft:建设方面目前还是属于一个临时的阶段,会有很多变化。有一个可能的结构,有一个可能的架构,但是依然还是没有确定的,John认为,就是说经济的原因在SKA里边的影响比重会越来越大,越来越需要钱,这些钱不可能说来自天文学家或者天文学,它只能来自工业界,比如说IT公司之类,因此政治的考虑应该会越来越重要,在整个SKA的项目里边。

  他认为基于这些原因,我们(英语)的作用在SKA会越来越重要。

  问:也就是说国家和计算厂商之间结合的能力,其实可能是SKA进一步在结合或者说是在资源方面的来源吧,可以这么讲吗?

  吴韶华:可以可以,就是这个意思。

  问:我问一个问题,刚才咱们提到的经济,关于钱方面的问题,那么我可以理解为整个SKA项目,它的资金来源其实是由各个参与国和各个参与组织来自筹资金,那么就中国参与这个程度来讲,中国是更可能与新建一个中心来进行数据处理,还是会利用现有的超算中心,比如说广州这些超算中心来进行?

  吴韶华:你这个问题应该是问我的吧。

  问:对对对。

  吴韶华:事实上咱们现在关于这个问题呢,应该也是处于研究的阶段,并没有一个定论,你也知道,因为SKA项目刚刚开展,目前比较可能的应该是咱们新建一个数据,实际上我们在数据处理内部联盟也是这种观点,最主要的一个原因就是SKA它需要处理的数据量实在太大了,这样一个数据中心不可能去做其他的用途,因为他其实全部用来处理SKA数据的话,基本上如果能有这个能力的话,应该很不错了,因为SKA整个对于计算规模的要求,应该是一千个P以上,因为大家也知道现在天河二号的峰值处理能力也就是50多个P,是一个非常巨大的差距量。

  问:那么这部分建设的资金,会由怎么咱们国家政府来出资承担这个建设的费用吗?

  吴韶华:我想因为我们国家是非常希望持续的加入SKA这个项目的,当然如果能在国家层面有这样的支持,那肯定是最好的,也是对我们天文学界以及计算机界,在大数据以及网络存储方面都是非常非常有帮助的。

  问:那么在超算中心这个计算架构,比如说用GPU或者麦克,这个决定权是在咱们浪潮自己决定,还是在国家层面?

  吴韶华:事实上这个问题其实是一个很开放性的问题,这个的决定权它并不在某一个厂商也不在某一个大学的手上,它是一个大家共同来研究各种不同的方案,从而挑选出到底哪一种方案才能最适合SKA,是这样的一个过程,你并不能很粗略地说一定由谁来解决这个事,事实上是不可能的。但是浪潮作为SKA这样一个的供应商,我们完全有可能实现任何可能的非常适合SKA的解决方案。

  问:我想问一下John几个基本的问题,第一个SKA这个项目是从哪一年开始的,有没有大约什么时间建成。还有就是咱们提到计算平台是从什么时候开始建的?

  John Bancroft:也就是说在John的认识里边,第一次关于SKA的讨论,应该是在90年代。

  问:90年代,而且英国觉得自己根本就负担不起这个事情。

  吴韶华:对,是在90年代。

  John Bancroft:SKA有两个阶段,SKA一有可能是在2021年前后完成,SKA二有可能是在2028年前后。但是SKA整个项目到最后停止运行的时间,比如说这个东西我们不再用了,有可能是2080年。

  问:我刚才问了第二个问题,就是咱们计算平台大体上是从什么时候开始启动的,正式建成开始投入使用,有没有一个什么预定的时间?

  John Bancroft:也就是说七八个月后在他们决定开始建设之前。

  问:大约什么时候能够建成使用,就是在南非或者澳大利亚的技术平台。

  吴韶华:计算平台应该是,这个数据我知道。

  John Bancroft:目前还不确定,只能这样说,从前面的天文望远镜传过来的第一批数据有可能会产生在2021年左右,这些数据也是需要被处理的,所以它的数据中心应该是在2021年左右就应该能够用了。它有可能是这样的一种方式,这是我了解的,因为我们是直接的参与,它有可能是分批建设的一种方式,不会说数据中心一下就完成了,它一批一批的来,建一批用一批,建一批用一批,直到最后满足SKA所有的要求。

0
相关文章