服务器 频道

走近全球最快的超级计算机:IBM走鹃

软件释放硬件潜能

    尽管硬件设计上是很奇特的,但由于在软件方面做了大量的工作,使得应用和开发变得简化。IBM Roadrunner首席设计师Don Grice相信,多核、异构计算是未来趋势所在,至少在未来10年内是如此。不过,他也认为,释放硬件性能的关键在于要开发出可以充分利用所有处理性能的软件。

    Roadrunner成了全球先进台配置Cell处理器的混合式超级计算机,也使得它需要三种不同的编程工具,程序员们也必须仔细考虑如何让十几个颗核心如何高效率地同时运行。

    IBM使用了其内部开发的软件开发工具套件(SDK)和开源软件来充当Roadrunner的应用平台。这一软件模式基于标准的MPI,每一个MPI任务使用了一个Opteron核心和一个CELL处理器。IBM的SDK DaCS库在CELL和Opteron之间实现了底层的协作,而在外层,Red Hat Linux 和xCAT 集群管理软件提供了应用的操作环境。

    要把这些混合型机器的性能释放出来,系统内存优化是一个非常关键的因素。“这看起来和我们当初从共享内存转向分布式内存的感觉非常相似,”Grice谈道,“现在我们需要解决内存带宽wall和异构核心的问题。”

    Grice承认,他们已经建立的软件模式只是构建易编程、混合型系统(如Roadrunner)的第一步。当你要把多种计算技术结合在一起(异构指令集heterogeneous instruction sets, 多核处理器multicore processors, 向量SIMD单元vector SIMD units, 局部存储local memory stores, explicit DMA, 片上芯片/片上内存网络on-chip CPU/memory networks, 远程加速器remote accelerators 和集群计算cluster computing),开发人员就需要一个框架来保证不同层面硬件的独立性。在后续的版本中,IBM会引入新的编程语言和编译器/runtime技术。

小结:超级计算机性能十年增长1000倍

    超级计算机性能每大约十年增加1000倍,Roadrunner再次印证了这一点,让计算机从TFlops进入了PFlops时代,而接下来将是EFlops、ZFlops、YFlops和XFlops——10的27次方。可见,超级计算机性能的发展速度已经快于摩尔定律。这也使得HPC业界和用户需要不断地思考:有哪些应用可以运行在这些优异的系统上面?更强的性能意味着你在进行计算机模拟时可以获得更高的精度,运算某一任务的时间更短。正如Grice所言,“一项需要Roadrunner运行一周来完成的工作,在10年前的一台机器上可能要跑上20年。”

    Hans Meuer教授根据对TOP500历史数据分析后预测说,到2015年,也就是8年后,TOP500排行榜中将全部是千万亿次系统!第一台Exaflop/s(1Exaflop/s等于100万Teraflop/s)计算机也将在2019年出现在TOP500上。

    事实是否如此,让时间来证明吧!
0
相关文章