从网络走向网格
“网格”的概念源于电力工业中的输电网。人们希望也能象使用电力那样方便地使用计算力,于是,“计算网格”的概念诞生了。网格是继因特网、万维网之后,成为互联网发展的第三个里程碑。从计算机技术的发展来看,计算机体系结构处在一种“分久必合,合久必分”的螺旋式发展趋势中。上世纪六七十年代,以IBM360为代表的集中式主机(Mainframe)/终端架构是主流。随着八九十年代PC技术的成熟,客户机/服务器结构逐渐流行。但由于各式各样的服务器分散在Internet上,导致管理费用过大。从九十年代后期开始,又走向了集中管理的服务器聚集(consolidation)模式,即把各种服务器集中在一个机柜中形成超级服务器。进入21世纪,网格(Grid)研究逐渐成为新的热点。人们希望把分布在世界各地的计算机和信息资源形成资源共享的网格(Grid),以提供更方便的服务。

从曙光3000开始,中科院计算所和曙光公司就开始积极投身于网格技术研究及“中国教育科研网格”的建设中,并在华中科大、中山大学、武汉大学等国内重点院校的“教育科研网格节点”项目中取得了较大成功。另外,曙光还与政府相关机构合作在合肥、西安、上海等地陆续建立了基于网格研究的高性能计算机研究中心,其中面向网格的硬件设备全部采用曙光3000超级服务器、曙光TC1700机群服务器等标准化系统。
目前,在面向网格的超级服务器技术研究方面,国家智能计算机研究开发中心和曙光公司开展了国家863计划高性能计算机及其核心软件重大专项支持的曙光4000研究项目,通过研究面向网格的高性能计算机,为网格提供计算力服务。其研究目标包括:曙光4000L Linux超级服务器、曙光4000A高性能超级服务器、10Tflops曙光4000面向网格的高性能计算机、曙光4000H生物信息处理高密度专用机群系统、曙光4000T具有自主知识产权的服务器。
2003年3月份,曙光推出了第一款专门面向网格的高性能计算机曙光4000L。该系统由40个机柜组成,最大可“在线”扩展到80个机柜,1300个CPU,每秒6.75万亿次峰值速度,4000G内存,600T存储的海量处理系统,并成功开发了两项网格使能技术,使系统具有网格环境下的优良特性。同年6月,运算速度达到4.2万亿次的曙光4000L正式交付中石油东方物探公司。

2004年6月,10万次运算速度的曙光4000A问世,并于2004年11月在上海超级计算中心正式开通,成为中国国家网格南方主节点。曙光4000A实现了国产超级服务器在主板设计等核心级技术上的重大突破和“工业标准机群”的技术增值,攻克了一系列“大规模机群”计算的关键技术,在性能价格比和性能功耗比等方面处于国际领先水平。
在2004年6月22日公布的全球超级计算机TOP500排行榜中,曙光4000A以每秒11万亿次的峰值速度和80610亿次Linpack计算值位列全球第十,这是中国超级计算机得到国际同行认可的成绩优异。随着曙光4000A的推出,中国已经成为继美、日之后第三个跨越了10万亿次计算机研发和应用的国家。

曙光4000系列HPC的推出,使基于服务(Service-based)的机群操作系统、网格通信协议、网格文件系统、用于网格应用资源路由的智能网卡、支持网格的高性能计算机体系结构等一系列网格技术也开始浮出水面。以曙光4000A为例,它提供了超级服务器所需的许多网格零件(Grid-enabling Components),包括网格路由器、网格钥匙、网格网关、网格监控中心、网格文件访问和织女星网格操作系统。