【IT168 应用】近年来,随着国家对HPC产业的扶植支持力度加大,我国HPC迎来了一个新的历史发展时期。各个城市高性能计算中心纷纷落成,HPC已经被使用到各个领域,能源探索、气象服务、物理实验、图像渲染……。云计算趋势的兴起使得HPC与云的结合成为HPC发展新契机。
高校作为科研创新前沿阵地,无论对云计算还是HPC,显然拥有极大需求。而且,从国外的经验来看,许多高校的高性能计算在世界上拥有很高的声誉。比如,美国伊利诺伊大学,德国斯图加特大学,日本的东京工业大学等。我国高性能计算在高校的发展也非常快,主要原因在于高校有更多的用户,许多学科,无论是化学、物理、生物、地球、航空、海洋等,都给高性能计算提供了用武之地。从这个趋势来看,未来高校对高性能计算中心的重视还会进一步提升。
作为HPC领域的领导厂商,戴尔在高校行业也展开了多年的开拓与耕耘,并在高校行业部署了多台HPC集群成功案例。
构建清华生命学院研究平台
成立于2009年的清华大学生命科学学院(简称“清华生命学院”)拥有生物物理与结构生物学等12个研究方向,同时拥有多个优异、省部级重点实验室。为进一步提升科学研究效率,清华生命学院决定采用戴尔高性能计算群集方案(HPCC-High Performance Computing Cluster)为结构生物学研究提供一个更为高效的研究平台,创造更为良好的研究环境。
清华生命学院最终决定引进1套大规模的44计算节点的戴尔HPCC系统,该系统由“计算节点”、“管理节点&I/O节点”、“存储后台”“计算与管理网络”4个主要部分构成:其中HPCC系统的计算节点由11台戴尔PowerEdgeTM C6100机架式服务器担任,每台C6100机箱内配置有4台刀片服务器,每台刀片配置了两颗2.4GHz英特尔R至强R5645 六核处理器、24GB内存(6x4GB)、1块3.5英寸7.2K RPM SATAII硬盘,2块Broadcom 10/100/1000Mbps 自适应以太网卡(支持TOE offload 引擎技术)
在软件方面,上述44个节点全部安装了Redhat Linux AS 5.4操作系统,并采用了Rocks管理软件,以及Intel程序编译环境,如C、C++、Fortran、MPI、mpich、OpenMP等,还有优化过的数学程序库(如:MKL、ACML、BLAS、LAPACK、Scalapack、FFT程序库等),在应用层面,清华生命学院则采用NAMD,Spider,Maq等专业软件系统进行结构生物学的研究计算。
华中理工及香港大学高性能计算平台
华南理工大学是国家教育部直属重点综合性大学,该大学的凝聚态计算物理研究室将自旋电子学的研究扩展到半导体领域,需要海量持续的计算平台作为支持。
华南理工大学引进了17台戴尔服务器构建集群计算系统。整套HPCC系统的网络连接方式比较独特,仅采用了1台戴尔PowerConnect交换机,即采用单一的千兆以太网实现节点间的高速连接,完成计算和管理数据的传输任务。这套HPCC系统使客户的计算处理能力得到了显著提高,以前需要1周时间完成的计算任务,现在只需1天就可以完成,效率提升了500%。
戴尔为华南理工大学提供了贯穿HPCC系统部署实施、运行维护两个阶段的技术支持。在部署实施阶段,戴尔与合作伙伴一同为华南理工大学提供了现场硬件上架、操作系统安装、CHESS管理软件安装、服务器集群(Cluster)配置与调试服务。并为华南理工大学定制了为期3年的金牌高级企业服务,协调戴尔及其合作伙伴的所有资源,处理与HPCC系统有关的软硬件问题。
同样采用戴尔高性能集群解决方案的高校还包括香港大学。据介绍,戴尔为香港大学设计了高性能计算集群(High-Performance Computing Cluster,简称HPCC),该系统专为先进的计算密集型学术研究而打造,适用于化学、物理、工程、环境及纳米技术等研究。该高性能计算集群同时也是中国国家网格 (China National Grid,简称 CNGrid) 的一部分,是中国大陆地区以外唯一的网格节点。中国国家网格是由11部超级计算机系统组成的网络,所有系统均选自大陆地区的特定机构。
戴尔位香港大学部署的HPCC,配备有计算能力高达每秒19.43 万亿次浮点计算(Teraflops)的240节点戴尔 PowerEdge M610 及 R610服务器,由1,920枚英特尔 Nehalem 处理器驱动,其中包含12台 PowerEdge M1000e及 192台 M610 刀片服务器; 55台 PowerEdge R610及三台 R710服务器,全部储存在六台 4220 42U 服务器机架内。数据储存在两台PowerVault MD1000 DAS阵列上,可在需要更多存储空间时实现无缝扩容。专有的高速互连包括Qlogic 9040 DDR 无限频宽通讯交换机、Mellanox M2401G DDR无限频宽通讯交换机以及戴尔PowerConnect 交换机,均有助于将集群及网格计算互连性能提升至最高水平,同时简化数据中心并降低成本。
以开放架构拓教育市场
《国家中长期教育改革和发展规划纲要》中提出:“信息技术对教育发展具有革命性影响,必须予以高度重视。”教育信息化是推动和实现教育现代化的重要手段,是帮助学校提高教学质量,帮助学生掌握面向21世纪技能的重要途径。长期以来,戴尔与其行业合作伙伴以及教育科研客户一起,共同致力于现代教育技术手段的创新。戴尔(中国)有限公司公共事业部教育行业总经理卢颂勤将戴尔在教育行业的成功归结为三点:开放标准化、深入的服务以及重要领域创新。
开放标准化:前期的超级计算机之所以逐渐被许多用户抛弃,封闭性是一个很大的原因,因为封闭对用户来说是很不利的。卢颂勤表示,戴尔致力于联合业内领先的合作伙伴一起在中国打造一个完整的解决方案生态系统,为客户提供开放、性能出色和高性价比的解决方案。其合作伙伴有英特尔、AMD等硬件公司,也有开放式管理软件如Platform,以及微软等,用户可以根据自己需求和喜好选择适合自己的厂商。
深入的服务:为了能够让用户把更过的精力放到业务上,并真正做到在业务层面对用户提供支持,DELL招揽了一大批各领域的行业专家,如基因学、石油、气象等,为各个领域的HPC用户提供专业的支持。
例如综合化的专业服务就是清华生命学院选择戴尔HPCC方案的重要原因之一。清华生命学院崔野老师介绍说:“因为我们的研究任务重,时间要求紧,我们需要将全部的精力投入到结构生物学研究之中,因此我们需要的是一个完整的HPCC系统,需要的是一个交钥匙型的工程,在这方面戴尔做得十分到位。在项目的规划阶段就成立了专门的项目小组,始终从我们的应用需求出发,不断地为我们修正和完善方案;在项目的实施阶段,戴尔承担了硬件系统上架、软件安装、网络调试等HPCC系统的全套建设任务;在维护阶段,戴尔联合Redhat、Intel等厂商为我们提供了端到端的技术支持服务。在戴尔的大力协作下,我们最终得到了一套高效、集约、稳定的HPCC方案。”
重要领域的创新:为了帮助用户更好地使用HPC,DELL在许多重要领域进行创新,如HPC数据架构、针对HPC的平台设计、优化的机架设计等。同时,对于一些新的技术趋势,如GPU等,DELL通过合作的形式为用户提供相应的技术,例如DELL与NVIDIA就有非常紧密的合作。
“戴尔C6100服务器+Infiniband网络”为核心的HPCC系统于2010年3月完成组装和调试,目前在清华生命学院已经运行了1年多的时间,整体运行状况非常平稳。清华大学生命学院崔野老师是这套HPCC系统的主要管理者,他对系统的表现给予了充分的肯定。崔野老师介绍说:“目前,生命学院结构生物研究的主要计算任务均由这套HPCC系统来完成。该系统的上线,有效地保障了我们在大分子研究方面的计算效率,与传统的机架式服务器组成的HPCC相比,采用戴尔C6100服务器我们可以节省50%的空间,节省30%以上的电力消耗,这可以让我们的运营成本得到有效的控制。”