服务器 频道

专访:曙光总裁历军谈高性能计算标准

     【IT168 专稿】近段时间,中外企业刀片服务器标准之争引起了不少媒体和读者的关注。但实际上,高标委(中国高性能计算机标准工作委员会)要做的还不仅仅是刀片服务器的标准,而是整个高性能计算体系的标准。7月10日,曙光总裁兼高标委主任历军接受了IT168服务器频道的专访,就高性能计算标准,以及曙光下一代超级计算机曙光5000A等话题进行了交流。(如果您对本文有不同观点,请给我们投稿:hongzhaofeng@it168.com, MSN: hzf21cn@hotmail.com 。)



曙光总裁兼高标委主任历军

曙光的角色与高标委的开放性

IT168:曙光为什么选择今年这个时候牵头成立高标委,来制定中国高性能计算标准,初衷是什么?

历军:这几年,高性能计算市场的需求很旺盛,但是由于没有统一的标准,各软硬件厂商之间的接口存在很大的障碍。比如在上海超算中心,虽然都有MPI,但我们的作业调度系统和其他厂商提供的应用软件之间由于没有完全统一的接口,使得硬件厂商和软件厂商之间处于隔离的状态,我们不得不花费很大力气来帮助用户开发这些接口。这种不统一显然对用户也是不利的,应用起来比较麻烦,而且要花费额外的代价。

    现在高性能计算机系统规模越来越大,结构越来越复杂,为了减轻用户在选购、部署、使用和管理系统过程中的负担,同时也是为了更好地扩大市场,推动产业更快、更好地发展,我们提出了构建中国高性能计算标准的想法,我想这就是我们唯一的初衷。

IT168:外界存在一种看法,认为曙光会主导这个标准,而如果企业色彩太重的话,标准的成功性就会很小,但据我了解,您在多个场合也强调过,高标委是个开放性的组织。那么,曙光在其中充当什么样的角色?高标委的开放性主要体现在哪些方面?其他服务器厂商持什么态度?

历军:在这里我要重审一下,首先,曙光无意于去主导这个标准,其次,就算曙光想主导,也主导不了,必然会失败,这是尽人皆知的道理。过去我们也看到,无论是价格联盟也好,技术联盟也罢,一旦存在利益分歧,就会马上土崩瓦解,所以,别说一家主导,就是几家一块主导也不行。我们做标准体系,一定是坚持“公平、公正、公开、协商一致”这样的原则,因为,如果不协商一致,就不会成其为标准,而如果一致的话,也就不存在谁主导谁的问题了。在高标委组织中,每个成员都有提案和投票的权利,体现的是全过程完全民主的精神。只不过谁的积极性高,谁就多干点活。曙光是牵头者,也是积极的参与者和推动者,这是我们的定位,高标委要做的是秘书处的工作,负责协调各方,共同推动这个事情向前发展。

    我们一直在谈开放的原则,哪家企业愿意加盟,我们都持欢迎态度。大家可能有误解,以为高标委只是做刀片服务器标准,其实刀片只是其中的一个领域,我们要做的是高性能计算体系的标准。比如在节能降耗等方面就有其他国外企业愿意参与进来。但我们认为,你想参与可以,但需要开放相应的技术。

    在对待中国标准问题上,国内企业至少都是持积极态度的,有些马上就加入了,但也有些因为有不同的想法,在观望。随着高标委工作的深入和不断发展,随着我们能够拿出一些有意义的标准提案,我想会有更多的人加入进来。虽然我现在还不方便透露具体厂商的名称,但现在已经有两三家国内服务器企业正准备加入。

${PageNumber}

中国标准将会是强制性的吗?

IT168:我了解到,曙光前不久已经通过高标委向信产部报批了大规模机群监控系统和刀片服务器管理模块两个技术规范,那么,其他成员单位的进展如何呢?

历军:曙光只是因为在这方面已经准备了两年多时间,所以我们能够率先提出来。其实,在节能降耗、电信级服务器、机房设计等方面,已经有研究机构、企业,甚至是用户正在提议或准备相关的提案,但这需要一些时间。

比如说,在高标委成立大会上,国家气象局信息中心的总工就建议制定高性能计算机机房设计规范。在高性能计算机和刀片服务器实际部署时,我们就经常发现,有些用户的机房明显存在不少问题,比如电力是否能够满足需求,接口是否一致,地板承重能力是否足够,以及散热空间、空调、UPS等方面都没有统一的规范,很多都是厂商推荐的,而厂商又难以摆脱商业利益的考虑,甚至有些推荐的配置在用户当地能否获得足够的资源,都很难说。因此,我们需要有一个系统的平衡设计,相信这个设计规范出来,对新机房的建设就会有较好的指导意义。

IT168:第一个可用的标准计划什么时候推出来?相关厂商和用户在系统选型与部署过程中,如何使用这样一个标准?

历军:我们争取在明年6月左右获批第一个优异的行业标准,很可能就是目前我们已经审报的两个标准中的一个。

     这个设计规范将会是推荐性的标准,曙光自已的产品首先一定会遵循这个标准,而且,我们在高性能计算领域也有不小的市场份额,我们的软硬件合作伙伴为了获得我们的生意,也很可能会支持这个标准,加上其他国内服务器企业逐渐加入的话,这个势就会慢慢形成。毕竟对许多企业来说,中国是全球最重要的市场之一。

IT168:这个标准会是强制性的吗?会不会成为国外产品进入中国的市场壁垒?

历军:高标委是民政部批准成立的一个民间性质的组织,我们会发布一系列设计规范,这些初期都是推荐性标准,而不会是强制性标准,但是我们也不排除以后向政府申请成为强制性标准的可能,最终能不能成,现在谁也说不好。至于厂商的产品是否符合标准,兼容性是否足够好,要由用户和市场来检验。

    当然,我们不会专门修窄轨铁路,限制国外产品进来,我们更希望向国际上先进的企业学习、借鉴,但是有一点,就是需要协商一致,国外企业要想进入这个组织,并在里面发挥作用的话,就得开放自己的相关技术,并且不能有日后收取专利费之类的限制措施。

IT168:中国做高性能计算标准,在制定、推广和使用过程中,还存在哪些困难和问题?

历军:问题主要是来自三个方面,一是如何争取更多的用户、更多的企业、更多的机构来支持我们,虽然现在业界有很多支持者,也不乏质疑者,但我的观点是,不做怎么就知道不行呢,有人说中国人放不了卫星,搞不了原子弹,可最终咱们不都成了吗?不敢想怎么能行。二是如何做到协商一致,许多国际标准都是相互争吵好几年才最终达成妥协与让步的,这需要一个过程。三是初期的一些标准如何逐步获得广泛的支持。我想解决了这三个问题,标准就会有它的生命力。

${PageNumber}

下一代高性能计算机将部分采用龙芯CPU

IT168:我了解到,曙光计划明年6月份将发布下一代超级计算机曙光5000A,跟当前的曙光4000A相比,主要创新点体现在哪些方面?

历军:曙光5000A是一个商用的高端产品,有一定的创新,但我们也要保证它跟前一代机器的兼容性。目前来看,曙光5000A在体积、节能、软件效率和可管理性方面都会有很大幅度的提高,它的性能将会是4000A的10倍,体积只有2/3,耗电只有150-200%。当然,这里面有芯片发展所带来的价值,也有我们在节能技术和高密度设计上的创新。

     另一个更大的创新点就是,多核龙芯处理器将首次在高性能计算机上实现应用,一部分计算节点会采用龙芯充当主CPU。当然,龙芯节点是一个最新的科研成果,需要不断地进行优化和改进,其中软件兼容性是个核心的问题,我们在这方面做了大量的工作。至于龙芯节点的可靠性如何,兼容性如何,我们想在明年产品研制成功后,会把它挂到网上去,用一周的时间完全开放给网友,让用户提交作业上去运行,自己去体验。

IT168:曙光5000A的第一个用户会是谁?另外,今年6月份发布的全球TOP500排行榜中,第十位HPC的性能已经超过50万亿次每秒,第三位超过100万亿次每秒,曙光5000A预计会排到第几位?

历军:曙光5000A已经有用户,但现在还不方便透露。

    我们保守估计曙光5000A进入前十位应该没有问题,当然具体排名还要看其他厂商和市场的情况。国外几个优异实验室有足够的经费,也在足够好的应用在支撑,所以每年都可以买最新一代的机器,而咱们国家还缺乏高端的、超大规模的高性能计算应用,所以我们基本上是三年时间推出新一代机器。我想通过这么多年的努力,我们主要的价值在于带动一大批中小用户慢慢熟悉高性能计算。

${PageNumber}多核冲击以及与微软的合作

IT168:现在有一种观点,认为基于多核CPU的大型SMP系统将会对中小规模机群造成冲击,而中小规模机群恰恰是曙光很重要的一块业务,您怎么看?

历军:这个观点有一定道理,但我不完全同意。从计算性能上来说,单核时代16个双路节点的机群有32颗CPU,而现在曙光一台八路四核服务器也有32个CPU,但我们也要看到,现在SMP可以用四核,机群里同样也可以用四核,所以性能还是有差别的。其次,很多应用不一定都适合大型SMP来处理,比如在数据库领域,大SMP有它的优势,但是在并行计算领域,大SMP的成本就显得太高了,而机群的性价比就很有优势。第三,现在SMP做到16路以上成本就很高了,目前曙光的产品也只是到8路为止,32个CPU的机群成本可能只是它的一半,完成任务的效果还好。所以,我认为,虽然在不同领域这两种系统各有所长,但总的来说,现在的趋势应该是机群在替换大型SMP主机,而不是相反。

IT168:据我了解,曙光跟微软在WCCS集群操作系统上似乎有进一步的合作,请历总谈谈合作的背景和进展情况?

历军:现在处于良性的阶段。我们看到,WCCS对曙光目前所看到的市场还是有优势的,比如跟刀片系统的集成,因为很多用户还是喜欢WINDOWS的风格。另外对采购64个节点以下机群,非计算机专业出身,对LINUX又不太熟悉的用户也很合适。从这个角度来看,WCCS是我们目前机群管理系统的一个非常好的补充。

[编者按]采访完历军先生,感触良多。作为媒体,我们既要保持自己的公正立场,又要表达出我们独立的声音。面对近段时间在业界闹得沸沸扬扬的刀片服务器标准之争,IT168服务器频道一直在关注。但我们认为,各方表达出了自己的观点,并让更多的国人来关注这个本来比较专业和比较狭窄的领域,不失为一件好事。无论是哪一方,我想,只要实实在在地为用户的利益着想,解决我们面临的实际问题或潜在问题,就应该得到支持和鼓励。相信很多人跟我们一样,都喜欢看到竞争的存在。虽然中国的刀片服务器标准最终能否取得成功,现在没有答案。但我们能看到,已经有一批人在路上,正在朝预期的方向努力。
0
相关文章