服务器 频道

教育国际化 曙光助力苏州大学建HPC平台

  【IT168 案例】如今,随着我国在科技人才的培养和教育资源方面的深度投入,国内各大高校为了应对日益扩大的教育资源需求和满足高校对学科研究的强大计算需求现状,在国内高科技厂商的支持下,纷纷建立了以高性能计算为基础的高性能计算系统平台。一方面能够满足自身院校在科研、学科以及重要课题研究等方面的高端需求,另一方面在科学技术的助力下,将进一步扩大院校的科研水平和研究能力,进一步提升院校在教育行业的影响力和科技实力。

  在国内知名服务器厂商曙光公司的助力下,国内院校包括清华大学、华东理工大学、华南师范大学等众多知名学府均已建立以提升教学质量和科研水平为目的的高性能计算系统平台,并获得了各大高校充分肯定,为高校在课题研究与教学提供了坚实的基础。

  苏州大学作为国家“211工程”重点建设高校和江苏省属重点综合性大学,自建立以来,就以“第一家以西式教育方式办学、第一家创办学报、现存高校中最早开展研究生教育并授予硕士学位、第一家开设法学教育”等第一而闻名。如今,苏州大学已设有多个科研项目以及建立高性能计算与应用研究所,为我国社会相关领域的发展提供了重要的学术支撑。

  然而随着研发力度的加大与科技研究项目的需求,原有的计算系统已无法满足当前的研究需求。同时,苏州大学高性能计算机系统目前运行着多个领域的应用软件。由于种类繁多、应用特点差异性大,对计算资源的需求更存在着巨大差别。因此,在此背景下,苏州大学需要续构建一个能满足其强大科研需求的高性能计算平台。为了保证该平台系统的成熟稳定、高可靠以及高性能特性,苏州大学选择了与在行业解决方案提供以及高性能平台建设经验丰富的曙光公司合作,欲通过曙光公司的行业经验来提升苏州大学的教学质量和整体的竞争实力。

  苏州大学建设曙光5000高性能计算集群系统方案

  经过反复的沟通,曙光公司根据苏州大学的特性与需求,为苏州大学提供了集先进性、兼容性、稳定性和完整性为一体的曙光5000计算集群系统方案。该方案由曙光5000高性能计算机群组成,采用开放的Cluster集群系统,能够满足现代高性能计算机对计算密度、能耗、可靠性、易用性等方面的要求,是目前高性能计算的非常好的平台。

 教育国际化 曙光助力苏州大学建HPC平台
系统拓扑图

  众所周知,曙光5000高效能计算机在体系结构、多处理机芯片组、高性能节点操作系统、高可扩展互连网络、高吞吐率通信软件、多线程分割全局地址空间编程模型及编译器等核心技术上均实现了较大突破。并在高效能计算机的高密度节点、可靠的系统结构、虚拟化软件、高效能海量存储、并行文件系统、大规模系统的管理软件、系统级鲁棒性技术、超大规模并行算法等产品及技术给予了充分的提供,为实现系统的高性能、可编程性、可移植性和稳定性奠定了基础!也为曙光所提供的相关解决方案满足用户多方面的需求提供了坚实的基础。

  此次方案在计算刀片的选择上,曙光公司选择了第三代刀片TC2600系列中的CB85-F计算刀片四路服务器。该服务器在具有高稳定、高可用、高扩展、高密度、高性能等优质特点,其整体优化的策略和人性化设计、超强的系统扩展能力、卓越的性价比和计算密度,将有效降低系统功耗,可覆盖用户更广泛的需求。

  该服务器采用7U/40PCS架构,共配置4个AMD Barcelona四核处理器,即每个刀片有16个处理核心。每刀片配置64GB内存, 1块160GB SATA硬盘,2个千兆以太网接口。其中,每个普通计算刀片可实现121.6Gflops浮点计算能力,每箱计算刀片服务器节点实现1216Gflops浮点计算能力。

  由于应用软件种类繁多,曙光公司为了使该高性能计算机系统保有较好的兼容性,选择了一向以配置兼容性良好而著称的Redhat AS Linux;同时为了满足高性能计算对存储的强大需求量,并保证系统的高性能和高可靠性,在存储系统方面,曙光选择了拥有高容量和高性能SAN存储系统。每台磁盘阵列通过4Gb端口连接到光纤交换机,每台IO节点都配置HBA卡,连接到光纤交换机。

  软件管理则由曙光Gridview服务器综合管理系统v2.0组成,该管理系统采用模块化设计,能够提供机群部署恢复中心、综合监控管理系统、统一告警平台、统计报表系统、作业调度调度中间件、IPMI管理等多种机群管理功能。

  曙光Gridview服务器综合管理系继承了曙光DCMM2、DCAS、曙光Gridview管理系统v1.1等监控管理产品的主要功能和技术特色,并增加多项优秀功能开发而成的机群监控管理系统产品。提供的统一集中式监控平台Portal,具备可扩展性、集成性、可靠性和易用性,能够满足同时对各不同厂家大型机的环境、硬件、软件等各方面进行监控管理的需求。

  总的来说曙光5000高性能计算集群系统能够满足苏州大学庞大的计算需求,该方案集成并融合了计算系统、存储系统、网络系统、电源系统、散热系统、监控管理系统、KVM等模块于一身,通过管理模块的自动优化调节,能够达到非常好的的运行状态,发挥出最优的整体性能。

  目前,曙光5000高性能计算集群系统已经部署完毕并且投入正常的使用当中,正在为苏州大学的学科研究和课题研究带去精准、高效的计算支持,为苏州大学教学质量的提高和研究进度的推进起到了重要的作用。

  曙光5000高性能计算集群系统的技术优势和特点

  先进性

  本系统采用使用高密度的刀片式集群系统,配合AMD的Barcelona四核处理器,整个系统的架构可以满足未来几年技术和应用发展的需要,使用时间长,可很好的保护用户的投资。曙光刀片系统TC2600是业界非常先进的刀片服务器,具有更高密度、更好扩展性和更好可管理性优势,相比于其他系统,曙光集群刀片服务器具有更优秀的可扩展性。

  完整性

  该方案为用户提供了一个完整的、整体的解决方案。在系统基础硬件之上,配置了SKVM系统和集群管理软件、作业调度系统,使得各个子系统可以完好整合。完整性还体现在:硬件和系统的完整性,应用的完整性,、完整的培训和文档。

  兼容性

  一直以来,曙光公司的产品设计遵循开放的原则,从不设计技术壁垒。而本方案所采用的X86-64平台是应用最为广泛的,兼容性具有较好的保证。在运行64位应用的同时,还可以兼容32位的应用,普通的32位应用软件更可以不经过重新编译直接运行在这样的系统之下,用户可由32位平滑过渡到64位。

  稳定性

  长期以来,曙光高性能计算机具有较高的稳定性和可靠性,此优势特点受到了用户的广泛赞誉和有关部门的认可。该方案所采用的计算机产品均全部符合高稳定性、高可靠性、高兼容性等特点。

0
相关文章