【IT168 案例】结构分子生物学研究、基因组研究、基因表达调控研究、信号传导研究是当今生物学研究的4大前沿领域。其中结构分子生物学研究其基础性战略意义更为突出,究其原因主要是因为生物功能由结构决定,生物大分子在表现其生理功能过程中,必须具备特定的空间立体结构,也就是通常意义上的三维结构。由于蛋白质是直接体现生理功能的物质,其空间结构对其功能影响更为直接,因此开展生物学蛋白质分子结构与功能研究是结构分子生物学研究的重中之重。
项目背景
成立于2009年的清华大学生命科学学院其前身是创立于1923年的清华大学生物系。经过清华老一辈科学家的不懈努力,新成立的清华生命学院即拥有生物物理与结构生物学、生物化学与分子生物学、细胞发育生物学、遗传学、植物分子生物学、海洋生物学、神经生物学、生物信息学、微生物学、肿瘤生物学等近二十个研究方向。同时还拥有多个优异、省部级重点实验室,包括:生物膜与膜生物工程国家重点实验室(共建)、抗肿瘤蛋白质药物国家工程实验室、蛋白质科学教育部重点实验室、生物信息学教育部重点实验室等。
面临挑战:
清华生命学院认为,其HPCC项目建设是一项系统性很强的工程,而遵循科学化持续发展的总原则是项目成败的关键。为此,清华生命学院对HPCC建设项目提出了集约高效、服务高质的明确要求。
集约性好
所谓集约性好就是要实现三个节省。第一HPCC系统要节省机房空间,要在最小的空间内实现最大的计算能力的输出;第二,HPCC系统要节省能源电力,要在相同计算能力的前提下实现最少10%至20%以上的电力节省;第三,HPCC系统要保持较低的运营成本,也就是说HPCC系统要结构科学,易于维护和管理,以减轻技术人员维护负担。
高效好用
所谓高效好用主要是指HPCC系统要在计算能力、I/O吞吐能力、系统构架三个方面保持突出的技术优势。第一,计算能力强,不同于其它领域的科研计算,蛋白质分子领域科研计算的对象主要是DNA、生物酶等
对象,而且计算任务需要模拟生物发育过程中蛋白质构象的动态变化,生物结构研究技术人员要求HPCC系统必须具备极强的计算能力,能够在短时间内处理海量的数据;第二,I/O吞吐能力强,数据传输是保证高效计算结果能够迅速转化成为成果的基础;第三,系统构架要先进,要采用标准化技术,采用开放先进的领先技术,例如:要采用专用双网技术,采用高效的Infiniband网络作为计算网络,避免I/O成为整个HPCC系统的瓶颈,再例如要超越传统的机架式群集模式,实现机架和刀片相结合的建设模式。
服务高质
所谓服务高质,就是指HPCC方案供应商要努力帮助客户减轻负担,将所有技术服务捆绑在一起,做到服务专业且全面、技术支持贯穿始终,为清华大学生命学院提供一个交钥匙型的HPCC工程。
解决方案:
选用拥有44个计算节点的以“戴尔C6100服务器+ Infiniband 网络”为基础平台的HPCC系统
2010年初,清华生命学院经过广泛考察、慎重选型、反复测算最终决定引进1套大规模的44计算节点的戴尔HPCC系统,该系统由“计算节点”、“管理节点&I /O节点”、“存储后台” “计算与管理网络”4个主要部分构成:
计算节点
HPCC系统的计算节点由11台戴尔PowerEdgeTM C6100机架式服务器担任,每台 C6100机箱内配置有4台刀片服务器,每台刀片配置了两颗2.4GHz英特尔?至强?5645六核处理器、24GB内存(6x4GB)、1块3.5英寸7.2K RPM SATAII 硬盘,2块Broadcom 10/100/1000Mbps 自适应以太网卡(支持TOE offload 引擎技术)
管理节点& I/O节点
HPCC系统的管理节点和I/O节点分别由2台戴尔PE R710服务器承担,每台PE R710服务器采用了2颗英特尔至强E5520处理器、16GB内存、2块146GB SAS硬盘的配置。
存储后台
HPCC系统的存储后台由1套光纤磁盘阵列担任,该阵列配载了15块容量为500GB的光纤硬盘。HPCC系统待处理的原始数据、以及处理后所产生的大量中间结果均存储在本套光纤磁盘阵列之中。
管理与计算网络
HPCC系统采用双网络结构,计算任务的执行和系统自身的管理分别使用1套网络,其中计算网络采用2台DR Infiniband交换机,组成了一套高效的Infiniband 网络,管理网络采用DELL PC2848交换机,组成了一套经济的千兆以太网络。
实施效果:
戴尔 HPCC系统浮点运算速度峰值达到每秒五万亿次(5TFLOPS), 清华生命学院生物学蛋白质分子结构与功能研究计算能力得到有效提升,与传统的机架式服务器组成的HPCC相比,采用戴尔C6100服务器可以节省50%的空间,节省30%以上的电力消耗
清华大学方面表示,“戴尔C6100服务器+ Infiniband 网络”为核心的HPCC系统于2010年3月完成组装和调试,目前已运行了3年多的时间,整体运行状况非常平稳。目前,生命学院结构生物研究的主要计算任务均由这套
HPCC系统来完成。该系统的上线,有效地保障了我们在大分子研究方面的计算效率,与传统的机架式服务器组成的HPCC相比,采用戴尔C6100服务器我们可以节省50%的空间,节省30%以上的电力消耗,这可以让我们的运营成本得到有效的控制。
综合化的专业服务是清华生命学院选择戴尔HPCC方案的重要原因之一。清华老师介绍说,因为我们的研究任务重,时间要求紧,我们需要将全部的精力投入到结构生物学研究之中,因此我们需要的是一个完整的HPCC系统,需要的是一个交钥匙型的工程,在这方面戴尔做得十分到位,首先,在项目的规划阶段戴尔就成立了专门的项目小组,该小组始终站在我们用户的角度,从我们的应用需求出发,从我们的预算出发,不断地为我们修正和完善方案;其次,在项目的实施阶段,戴尔承担了硬件系统上架、软件安装、网络调试等HPCC系统的全套建设任务;在维护阶段,戴尔联合Redhat、Intel等厂商为我们提供了端到端的技术支持服务。在戴尔的大力协作下,我们最终得到了一套高效、集约、稳定的HPCC方案。