【IT168 案例】千百年来,人类始终思考万物的起源,很多先贤仰天长问宇宙到底是什么模样,物质到底从何而来,我们人体何以能活灵活现,如果宇宙万物是自然形成的,那到底是怎样自然形成的?要回答上述一系列的问题,我们不得不努力探寻宇宙的起源。
关于宇宙起源的研究总是与粒子直接相关,因为宏观和微观并不是完全的相对,它们有着必然的联系,宏观的基本就是微观。宇宙浩瀚无边,目前人类无力全面的了解和研究宏观宇宙,从微观了解其基本的结构,即研究构成宇宙的粒子就成为非常重要的手段。
项目背景
目前,中国科学技术大学正式参与了LCG的站点建设,并为之成立了专门的机构――中国科学技术大学粒子物理计算中心,初期目标是建设成LCG 的Tier-3,最终目标则是建设成Tier-2.该中心将承担LHC 的ATLAS(A Toroidal LHC ApparatuS探测器)、CMS以及部分天体物理和理论物理的高性能计算任务。
面临挑战:
使用普通的数据计算设备从事上述计算将耗费极长的时间,如果不采用网格计算系统,则根本无法开展有效的研究工作,更谈不上快速地推出研究成果,从而使研究工作失去了本质意义,正因为如此,中国科学技术大学参与的LCG 计算网格建设项目具有非常重要的现实意义,需要引进品质卓越的网格计算平台。
高品质计算平台-揭示宇宙奥秘的金钥匙
中国科学技术大学“高性能网格计算平台”不仅是自身开展研究的重要平台,而且是全球“LCG 计算网格科研平台”的重要组成部分,其战略意义重大。为此中国科学技术大学非常重视,并确立了高品质运算、高效率运行并重的计算平台选型要求,即计算平台要性能卓越、稳定可靠、设计先进且经济性好。
高效的技术支持-让研究工作更有保障
中国科学技术大学的IT维护人员极为短缺,现在暂时由研究组成员负责系统的日常维护,如果维护量过大,不仅占用研究人员的精力,而且还会影响研究工作的进度,为此中国科学技术大学要求硬件设备供应商,必须提供全面、周到、快捷、方便的技术支持服务。
中国科学技术大学对设备供应商的服务要求如下:首先,服务要全面,服务范围必须涉及设备部署上架、软件安装调试、后期设备维护等所有项目;其次服务要快速,在4小时内提供响应服务;第三,服务要便捷,厂商要有专人负责相关事务,能够提供单一服务界面处理服务器硬件、相关软件等所有与HPCC系统相关的人员调度和备件调配等事项。
解决方案
最终,以英特尔至强E5520处理器为计算平台的戴尔PowerEdge M610刀片服务器胜出,戴尔刀片全面担纲了中国科学技术大学高性能网格计算平台的基础建设任务。
在硬件方面,中国科学技术大学粒子物理计算中心引入了64片戴尔PE PowerEdge M610刀片服务器,4台戴尔PowerEdge R710机架式服务器、2台戴尔PowerEdge R900服务器和6套MD 1000存储阵列;在软件方面,采用了CERN定制的Scientific Linux CERN 4(SLC4)操作系统、CONDOR网格调度系统和和GridView监控软件;在服务方面,戴尔为中国科学技术大学提供了从规划、部署,到后期维护三位一体的专业技术支持服务。
实施效果:
目前,中国科学技术大学高性能网格计算平台一期工程已经基本建设完成,很多研究项目已经开始进入试运行状态,在实际应用的过程中,用户普遍反应,中国科学技术大学高性能网格计算平台具有较高的计算性能和良好的稳定性,可以连续24小时不间断地对外提供稳定高效的服务。
在计算能力方面,中国科学技术大学近代物理系博士生导师,负责LCG网格系统建设的韩良教授表示,新建的高性能网格计算平台系统与以往各个院系自建的计算平台相比,其计算能力提高至少7-8倍,使学校科研计算总体能力上升到新的台阶。此外,该网格计算平台作为LCG网格的有机组成部分,实现了计算能力从“有限”到“无限”的飞跃。
谈到选用戴尔刀片服务器的原因,韩良教授表示,“戴尔PE M610刀片服务器均采用了冗余磁盘、冗余电源等设计,对于系统保持不间断的运行状态非常有利,这为LGC网格的平稳运行奠定了基础。另一方面,与传统的机架服务器相比,戴尔PE M610刀片服务器作为一款采用4核技术的高密度计算服务器,它的处理性能相当优异,不仅如此,它的整体性价比要比相同级别的机架服务器高出10%以上,在节约空间、能耗、散热等方面都具有突出优势,这非常符合我们兼顾性能先进性与投资经济性的选型原则。”