服务器 频道

看淡TOP100排名 访曙光公司副总裁聂华

  记者:您刚才也说了建设超算计算中心的话成本非常大,与云计算结合之后,您觉得投资高性能计算他那么大费用是否会产生一些泡沫?或者是现在的应用情况是不是已经到了运营超高计算。高性能与云计算结合之后,运营比以往的高性能计算更为广泛。

  聂华:其实过去拉动高性能计算机往大做的强大动力,有大规模的科学问题没有机器能解决他,所以产生一个要求计算机越做越大的强大动力。包括163机(不确定),很多国家重大工程里边我们该是由于要解决这七个问题所以我们需要大型机器。今天确实另外一个倾向出来了,我们科技部专家论证,我们做亿次计算机,十亿次计算机,这里两声音出来了,一种是既然用不满,我做两个千万亿次比做一个十亿次更省钱。另外还有一个说法,其实很多时候现在我们不能追求这么大一个机器,一年纯电费上亿。现在很难为某一个单一应用去运营它,因为你如果这一台机器运行一个应用,一年别的费用不说,给他的电费一年一个亿。这是两种不同思想都在交锋,你会发现目前现在是什么?当我们到了今天的时候,一个是现在面对我们现在经济是非常的活跃,当你有一台特别大型计算机出现之后,他会拉动整个我们平均计算规模一个提升。像上海超算从来不是一台机器只有一个应用,可能是一台机器给上百个应用,十万亿次规模平均应用的计算量级,平均值在不断增长。这里边来讲高性能计算本身就是一种拉动。

  第二角度来看,我们目前现在也有一种动力在向一些专用计算机做。为什么有这个动力向专用计算机做呢?确确实实针对一些问题对他加速、优化的时候会让整个设计变得更容易。曾经最难偏偏设计计算机就是给上海超算做的。你用什么?什么都用,你关心哪个指标?全都关心。就变成你最难给他设计的,内存及其大,存储及其大,网络及其大,这种应用可能只占1%,他可能用到。一旦他可能用到,他就要求你必须整机做成这样。这点也是我们设计上的浪费,未来我的理解是两条路都会走,一条路是我们机器规模仍然相当大,只有有了大机器才会拉动应用往大了做起到一个强拉动作用。他有这个挑战,过去在256节点做的,没有那么多应用,不会调试什么1000节点做。拉动应用往上上。另外在探索一些领域往一些专用的特定领域做计算机。

  如果谈泡沫的时候,我只表达一个观点,不能为做计算机而做计算机,尤其不为排名而做计算机,我表达为应用做计算机,怎么做都没有问题。

  记者:谈到星云,比如在今年十月份,他的计算能力降低之后很好适用云计算?

  聂华:不叫性能降低,峰值计算能力只是其中一个指标,首先机器变成两台,一台是面向高性能计算,另外一台是面向云计算。面向云计算的机器你会发现他的网络,他的内存、他的存储,他的很多大量的指标都跟过去做的指标不可同日而语。不能说仅仅由于GPU少了峰值降低,这个机器指标降低。我看来这台机器指标提升了。撤掉GPU,大量增加其他部件和其他能力的话,显然峰值会下浮,其他能力是大幅度提升。

  我的感觉是恰恰体现一个理念,要为用计算机而造计算机,这个可能恰恰在体现。深圳超算让我尊重就是他是经济发达的事业单位,以深圳经济实力最有资格做公益计算机,政府管,我来养,进行产业升级就需要这个,你投多少钱也需要。但实际上恰恰是超算中心,他是从目前我们面对这么多超算中心里面大一定要自主运营,将一台机器变成可以产生一个持续运营一个。目前愿望及其强烈,这个我觉得我很尊敬深圳超算中心。

0
相关文章