二、10万核以上的超大规模计算系统出现,应用堪忧
在今年的TOP100排行榜上,出现了两台拥有10万个处理内核以上的超级计算机系统,这些内核包括普通的CPU核和GPU核。其中,天河一号的计算内核数更是超过了20万颗,达到202752颗。TOP10系统采用的处理器核数如下表所示:
排名 | 安装地点 | 厂商型号 | 处理器核数 |
1 | 国家超级计算天津中心 | 国防科大天河一号A | 202752 |
2 | 曙光公司 | 曙光星云 | 120640 |
3 | Mole-8.5 Cluster | 33120 | |
4 | 上海超级计算中心 | 魔方/曙光5000A | 30720 |
5 | 联想深腾7000 | 12160 | |
6 | 成都超级计算中心(二期) | 曙光星云 | 5720 |
7 | 中国科学院计算技术研究所 | 曙光生物专用机 | 4160 |
8 | 工程公司 | IBM xSeries x3650M2 Cluster | 8960 |
9 | 中国电信 | HP Cluster Platform 3000 BL460c G6 | 7848 |
10 | 网络公司 | IBM BladeCenter HS22 Cluster | 7168 |
这种超大系统的出现对技术和应用两方面都提出了很多挑战,包括计算效率、功耗、管理、I/O、占地面积、应用软件等等,尤其是应用软件可能会成为很大的瓶颈。据上海超算统计,2009年其使用16核以下的作业占到了60%,17-160核的作业占39%,160核以上仅仅占到1%。这也意味着很多大机器被各类超算中心买去之后,实际上都会拆分成若干块分给不同单位或部门去使用,因此并没在起到大机器应有的作用。
▲
要解决这个问题,一方面,我们需要开发出可以使用到千核以上的应用,以充分发挥大机器应有的作用;另一方面,其实也可以考虑将“HPC与云计算”更好结合,让高性能计算资源池化和自动化,让更多中小企业来使用。