服务器 频道

参加全球超级计算大会SC08的一些体会

   【IT168 专稿】2008 年11 月15 日-21 日,在美国Austin 召开了SuperComputing 2008 大会。我正好在美国做访问学者,这次终于有机会亲自参加了SC 的大会,下面是一些零散的体会。

关于SuperComputing

    SuperComputing 是一个很大型的会议。今年是SC 的20 周年,虽然金融危机的阴影还在,SC08 仍然能吸引1 万多名参会人员和3000 多家展商。SC08 的会场在Austin 的Convention Center,相当于北京的国展,有很大的展厅和多个大型的会议室。

    SC 是个很“Industrial”的会,据说主要参加SC 的是美国的几个优异实验室,他们是潜在的HPC 大买家,很多公司都来向他们展示自己的产品。而IPDPS 等则是偏“academic”的会,有些学术圈的人并不参加SC。参加SC 的人也有很大一部分只是看展览,不参加学术会议。

    尽管如此,SC的日程还是安排的很满,会前3 天就排满了Education,Tutorial 和Workshop,正式开会3 天同时举办展览,会后还有半天的panel 时间,整个下来要一星期左右。SC 高峰期经常同时有4-5 个以上的session 举行,在中午和下午还有数不清的BoF(Birds of a feather,一种对某个主题感兴趣的人凑在一起非正式讨论小组)。一个人要想了解整个会议的进程除非有分身法不可。

关于ExaScale(百亿亿级)计算的讨论

    ExaScale 在这次会议上是一个热点的词。既然Petaflop 已经成了即成事实,大家很自然的关注起下一个milestone 来。

    基本上公认的是2018 年左右Exaflops 就会出现,处理器规模可能要达到上百万。但Exaflops 首要问题还不是应用和编程的问题(对美国这些大的实验室看起来计算能力是来者不拒),而是功耗的问题。估计按现有的技术路线,到时候Exaflops 的功耗将达到100MW以上,而能被接受的只有20MW,存在一个巨大的鸿沟。其中计算本身的功耗占的比重并不大,而主要的是memory 的功耗问题,有人提出Cache 要针对功耗而不是性能进行优化。与会者比较看好flash 技术的发展。

    我参加了一个Exabyte Storage 的workshop,发现不是讨论类似google 的海量数据处理,而是专门讨论Exascale 时存储怎么支持check point。据估计到时候,平均每个时刻有100~1000 个故障的部件要动态的处理。大规模系统的部件故障问题这次参加曙光5000 测试的人应该有体会。
 

PGAS(分区全局地址空间)编程环境

    PGAS(Partitioned Global Address Space),是为了支持用共享内存的语义在分布式系统上编程的新的编程语言,解决生产率问题的研究热点之一。这次会上有专门的PGAS 的Tutorial,HPCS 计划中Cray 的Chapel 和IBM 的X10 都已经发布了初级的版本。支持全局地址空间的UPC 和CAF 等属于分布式控制的语言,而Chapel 和X10 属于全局数据和全局控制类型的新并行编程语言,有很多有趣的特色。不过目前还只是功能级的实现,并行编译和优化还有很长的路。

    在HPCC Challenge 中专门有一个并行编程语言是否简洁优美的challenge,每个参赛人除了汇报性能外,还要讲自己的代码多么短小,易读,精简。因为这种评价很难量化,最后1000 美元的奖金由Cray,IBM 和Matlab 三家均分了。

    在一个PGAS 的BoF 中,Chapel、X10、UPC、CAF、titanium 等都有人出席。有个观众问一个比较tough 的问题,如果要选一个PGAS 语言开始尝试,哪个最好?最后的结论是UPC,因为UPC 目前有很多家支持。

TOP 500 的发布

    Top500 的颁奖是在一个BoF 上发布的,还不算SC 大会的award。 感觉在SC 的会上对Top500 其实没有外面那么关注,参加的也就几百人。TOP 10 的计算机出现在一页ppt 上,并没有单独介绍。介绍人提到曙光计算机时,特别提到了Windows HPC。还说这不是曙光第一次进入前十,大概5-6 年前也有一次。可见他的印象中中国的昙花一现已经是很久以前的事了。

    大会上给前三名当场颁发证书,有趣的是有人给前三名领奖者分别捐了个T-shirt,让他们当场穿上。只记得第一名写的字是“mine is biggest”。曙光这次虽然是第10,但是得到了一个亚洲第1 的奖状。可惜的是事先沟通不畅,上海超算和曙光都没人到现场领奖。

    第1 的roadrunner 是一种鸟,第2 的jaguar 是美洲虎。而第1 和第2 只差很少一点。于是有人开玩笑说:“jaguar chased roadrunner, but failed.”总之感觉top500 的发布会比较轻松,属于圈子里的人自娱自乐。
 

展会和我们的展台

    这次SC08 所里因为签证问题只有孙毓忠老师一个人成行,我和熊劲是因为已经在美国做访问学者了。我少不得帮忙站站摊。我们租了一个最小的展台,在最远的角落里面,不过看到计算所的名字和logo 还是倍感亲切。中国的学者到了这里都会驻足,问候一下。很多人都觉得我们是中国大陆第一次来参展(实际上是第二次了),觉得很高兴。美中不足的是我们没有什么展品和宣传材料,只能凭嘴巴吹吹牛。唯一的展品就是一个龙芯的小笔记本,样子很不错。我试图把它的无线网配起来,可惜往往只能通几分钟,载一个网页就断了。明年我们已经预租了一个展位,而且联系了曙光运台机器过来,早点计划,会有更好的效果。就是别再被签证搞被动了。

    SC 的展会很大,但是和大会是同时的。为了“向前看”,我选择是不在展会上花太多时间。走马观花的看了一圈,发现打着Personal SuperComputer 旗号的有很多,有GPU,FPGA,X86 多核的各式各样的产品。Sicortex 又表演了一次用几个人蹬自行车的动力来驱动计算机。

    不过这次知道SiCortex 是以前的Alpha 设计者出去创办的公司,不觉多了一丝敬重之心。另外,在会上看到了好几家QSFP 接口40Gb 的Infiniband cable,大多是基于光纤的,看来这将很快成为的工业标准了。这次曙光没展位,不过在微软的大屏幕上看到了关于曙光5000的短片。

    美国的几大国家实验室都有很大的展台,展示了他们的各种的应用,都有很漂亮的可视化的展示。毕竟他们才是这次大会的主角。

学术报告

    我听别人建议,正式的学术文章都有pdf 可看,应该更关注非正式的会议。所以正式的学术报告我没参加几个。给我印象深的是一个用GPU 做Dense Linear 计算的优化。用新平台去研究“老”问题,还能取得很好的结果。一个研究基于Sun 的Proximity Communication做switch 的研究。感慨是,传奇中SUN 的PxC 居然还没死掉仍在继续,虽然他们的原型芯片只有1Gbps 每channel。

    SC 的特邀报告反倒不很吸引人。Dell 的报告后来做起了广告,Patterson 的报告内容看过很多遍了。最后一天的报告讲起未来的能源问题,也没给出可能的解决路线,只是说400年前工业革命时,烧木头不够用了,最终才找到了煤开采的技术;现今的能源危机也许会有解决的方法的。
 

ACM Gordon Bell prize

    Gordon Bell prize 是SC 会议上奖金最多的一个奖(10000 美元)主要是奖励真实应用在HPC 上取得的效果。以前的印象这是一些专用机的天地,但我听了一个final list 的session后,立刻就开始后悔没去听之前的另一个了。

    今年的候选者,大都是在Top10 的机器上做的工作。我听的session 里有用RoadRunner做分子动力学的工作,通过在Cell 上优化存储访问,最终达到了几百个T 的实际效果。给我印象最深的一个工作,是将计算量原来O(N3)改进到了O(N),并且在jaguar 上进行了近400T 规模的计算。算法改进的效果是做系统的人难以想象的。这个最终获得了算法改进奖。

    最终峰值性能奖获得者是用Jaguar 做超导研究的工作,报告我没听。他们的题目是Sustain400T performance…,用了150000 个计算核心。SC 颁奖安排在正式会议的最后一天,虽然在主会场,但去的人冷冷清清,一会儿就结束了,还没Top500 热闹。

    我在国内很少听说有1T 以上计算规模的应用,听到这么多有几百T 的实际性能的应用在跑真是感慨万千,看来Exascale 的应用肯定也没有什么问题。

一个关于“破坏性”技术的panel

    这个题目太吸引人了,于是专门去参加。Panel 介绍了4 个技术,分别是硅光技术,3D芯片,Flash 和量子计算。

    硅光技术介绍者列出了一系列光技术进展,试图说明光技术的到来不远了。3D 芯片则给摩尔定律的未来谋求了一个出路,人们更关心多出来的晶体管干什么用。比较令人意外的是讲Flash 的人来自Sun 公司。

    量子计算的是来自D-wave 公司的人,号称拥有最多的量子计算专利。会上展示了他们的照片,很多管道和罐子,最终通向一小小的工作在超低温的芯片上面。首先,他直接说量子计算是一种专用技术,不会替代现在的通用计算机,但是有些现在计算机做不到的问题可以用量子计算解决,最后他很有信心的说到09 年他们会展示和现在主流PC 性能差不多的量子计算机。

最后的建议

    如果用一个字来描述SC,那就是“大”。大会上有太多的信息。下次计算所组织参会,至少也得5 个人以上,分别听各个session 报告,看展会,看摊等,才可能全面把握SC 的新的信息。明年在Portland 的会议,希望能组织的好一些,除了让更多的人早些拿到签证参会,事先能按计划分工一下,可能取得的效果会更好。

    如果用两个字来形容SC,那就是“钱多”。这样的会议规模很容易让人联想起一些商业的展会。大会除了宏大的场面,有一个信息可能对所内同仁有用,那就是SC 有个Broad Engage Program,专门资助经济有困难的学者参加会议,包括路费和食宿。注意是学者,而不只限学生,而且对中国大陆的学者申请也是接受的。到时候大家可以关注一下会议的网站。

    本文作者简介:陈明宇 博士,研究员,中国科学院计算技术研究所,国家智能计算机研究开发中心,研究方向主要为高性能计算机体系结构和操作系统,目前参加智能中心先进系统实验室研究工作。E-mail: cmy@ncic.ac.cn
 

0
相关文章