服务器 频道

高端:面向网格和HPC的机群整体方案

    经过对需求的分析,可以确定甘肃省高性能计算中心(网格系统)的建立是利用网格技术实现大规模科学数据集的协作虚拟化,实现高要求数据分析所进行的分布式计算(共享计算能力和存储空间)。网格将在科学计算、信息集成领域一展身手,提高甘肃省的科学计算能力,是典型的高性能计算应用,需要大规模HPC系统。

    对应于甘肃省高性能计算中心的实际需要,曙光公司在本次项目中采用了基于机群架构的设计思想,采用最新的超级计算机曙光天潮TC4000L,该款超级服务器是一台成熟的产品,采用大规模机群体系结构(Massively Cluster Computing),其中采用了许多创新技术,在平衡创新和可靠性上采用了冗余设计方法,每个创新部件都有成熟的产品部件与之对应,使高性能计算机的可扩展性得到很大提高,同时保证应用饱和性能的稳定。

    曙光4000L大规模机群系统的规模为22个计算节点,每个计算节点2颗AMD Opteron 64bit处理器,总共44颗处理器,1个I/O节点、1个管理登录节点,均为双AMD Opteron处理器节点。在应用性能方面提高MCC系统应用饱和性能的方法包括,提供轻核心操作系统,单用户通信软件、并行I/O库,支持多种操作系统;而在系统动态重构方面可提高MCC系统的管理能力,提供多种使用模式,包括开发大规模KVM(Keyboard-Video-Mouse)管理网络,操作系统动态加载等。整体系统架构如下。
 


    不过,虽然有了这台超级计算机,省计算中心还有着更为雄心勃勃的行动——建立近两年在国际上开始发展的网格,针对甘肃省以高能计算所为中心建立甘肃超级计算网格的设想,在此套解决方案的网络子系统设计方面,本项目为曙光4000L大规模机群系统配以3套网络,分别是高速计算数据传输网,千兆数据交换网络和管理网,分别用于并行计算时的数据交换、计算通讯以及I/O读写;用户接入、系统管理控制。高速计算网采用InfiniBand网络,千兆数据交换网络,两套网络可以互为备份,即千兆以太网可以作为InfiniBand网络的备份,千兆以太网可以作为千兆以太网的备份。而且本次项目中所提供的网络交换设备均在曙光机群服务器中有大量的成功应用案例,所选用的产品无论是产品质量、性能、互联、互通性都有所保证。

    另外,曙光4000L采用数据交换网和管理网分开的方式,有效地减轻了对数据网的负载,做到系统管理对业务网络完全没有干扰。接入管理网采用了百兆以太网,在本项目的曙光4000L机群系统中,采用了1台DLink公司的DES-1024,24端口百兆交换机组成一个百兆以太网,各节点通过它连接成百兆的管理网队整个机群的管理、监控。而千兆计算网络主要用于机群的、登录、任务调度等系统管理员常用工作。这个网络既是用户接入、系统管理网络,也是高速数据网的备份网络。通过网捷网络的IronView网络管理软件,网络管理员可以通过一个中央工作站控制所有网捷网络产品软件和配置的升级,极大地简化了网络分配、故障诊断和清除,从而减少安装和维护一个世界级网络基础设施的总成本。


    在规划、建设曙光4000L的存储系统时,曙光推荐了DS-3160/FS磁盘阵列,内部硬盘为Ultra 160接口,主机端口为2Gb FC或Ultra 160 SCSI接口标准的磁盘阵列系统,通过灵活的可配置性,提供一种强有力的,高性价比的RAID解决方案,从而更好的控制整体成本。

0
相关文章