【IT168 专稿】亿万富翁大卫•H•默多克(David H. Murdock)当初往北卡罗莱纳州研究园区注资5亿美元时,他的设想是建立世界上首屈一指的营养和疾病研究中心。这家公私合资企业旗下包括大卫•H•默多克研究所(DHMRI),当初设立这个公共慈善机构是为了支持北卡罗莱纳州研究园区从事开拓性的研究工作。DHMRI的总部设在北卡罗莱纳州坎纳波利斯,拥有世界上同类研究机构中最庞大、非常先进的一套科研设备,包括基因组学、蛋白质组学、代谢组学、显微镜学和核磁共振等领域的非常先进技术设备。
可靠的HPC合作伙伴
DHMRI从事的一些计算任务需要许多台计算机协同运行,以便在一段合理的时间内完成分析。为了满足对于高性能计算(HPC)的要求,该研究所求助于戴尔公司。DHMRI的信息科学主管Mark Burke说:“我们的HPC集群基于配备英特尔至强处理器的戴尔PowerEdge M600刀片服务器。我们的构建模块就是戴尔M1000e刀片机箱,我们知道这些刀片机箱会投入到生产环境中,长期得到支持。”
戴尔咨询服务公司与DHMRI共同设计的这个集群具有灵活性、模块化和可扩展性。Burke说:“当时,我们对于HPC集群的要求不是很明确——实际上我被告知,构建的集群要能够支持我们的科学家所能想到的任何任务。为此,唯一的办法是建立一个完全模板化的可以利用多个交换结构(fabric)的集群;视任务类型而定,可以将交换结构添加到集群上运行。”
DHMRI通过戴尔购置了集群的每一个部分,包括Mellanox的InfiniBand互连器件、Force10的以太网交换机和Platform Computing的集群管理器软件。戴尔部署服务只用三个星期就部署好了集群。
Burke说:“我们在建立这个集群之前考察了好多家供应商;我对于戴尔的要求是,我想要一家供应商来负责所有方面。那样,如果我的集群遇到了问题,只要打一个电话就行。结果,我们对于设备和戴尔支持服务都非常满意。”
需要速度
HDMRI的任务之一是提供基因组分析,那样该园区的不同研究小组就可以利用分析结果。DHMRI使用专门的基因组测序仪器和基因分析软件来生成原始数据,然后把该数据处理成一种易于使用的格式。测序过程目前每星期生成约5太字节(TB)的原始数据。如果使用测序仪器供应商销售和推荐的服务器解决方案,分析原始数据大概需要五天才能完成——这个速度对Burke来说不够快。
他说:“我们需要能够在最短的时间为向客户提供最高质量的数据。于是,我们决定不购买那家测序仪器供应商推荐的计算设备;而是使用配备英特尔至强处理器、运行红帽Linux的戴尔PowerEdge R900服务器,构建了一款解决方案。我们立即把处理其中一项任务(分析数十亿个DNA碱基对)所需的时间从5天缩短到了38个小时。”
DHMRI的数据中心设备有相当一部分是戴尔产品,DHMRI统一采用了戴尔Latitude笔记本电脑和戴尔Precision工作站,以满足客户端的计算要求。Burke说:“我们更希望采用同类中非常好的的硬件和专业服务方案,而戴尔在许多研究领域满足我们的这一要求。”
满足最后期限
虽然PowerEdge R900端的处理时间得到了大幅缩短,但Burke想得到的不止这些。研究项目的最后期限日益迫近,于是他联系上戴尔公司,解释了需要更多的内存和功能更强大的处理器。戴尔工作小组立马提供了一款试生产的戴尔PowerEdge R910机器,该机器配备128GB内存(可扩充至1TB)和四个英特尔至强7500系列处理器,每个处理器有八核。
Burke说:“我更喜欢使用英特尔处理器。它们是稳固的平台,其架构又很适合我们处理的工作,即经常运行数百万次的运算。新款英特尔至强处理器的绝对计算能力和内部总线速度相当惊人。”
由于戴尔工作小组响应迅即,Burke得以满足了研究项目的最后期限。他说:“同样的工作在戴尔PowerEdge R900上要花38个小时才能完成,但在R910上只需要花22个小时,处理时间缩短了42%。于是,我们现在能够极快地获得处理结果。另外,我们只是从同一家供应商购买了第二台基因组测序仪器,而由于R910具有高性能,我们不必购买第二台服务器来分析数据。一台R910就能处理这两台仪器的结果;我们将来能够扩充内存,以满足更复杂算法的需要。我们还会改变R900的用途,将它用于另一个研究领域。”
更多HPC信息请关注:高性能计算社区
迅速获得投资回报
戴尔PowerEdge R910将显著减少基因组测序研究所需的电力和冷却资源。Burke说:“由于英特尔7500系列处理器功耗较低、散热量较少,这种新的CPU架构本身就能将我们的电力和冷却成本减少40%。”
该研究所还会要求用数量更少的服务器来满足升级基因组测序平台的需要。Burke说:“我们的测序供应商发布了一款新的平台,每星期就能生成20TB的原始数据。与往常一样,这家供应商推荐使用特定硬件来处理数据。我会再次不理这个建议,与戴尔合作,对功能更强大的基于PowerEdge R910的处理系统进行微调。”
虽然DHMRI计划一旦迁移到新的测序平台,就使用多台R910,但目前使用的R910完全能收回成本,而且很快收回。Burke证实:“我们在PowerEdge R910方面的投入很快会获得回报。服务器在三个季度内就有望收回成本。”
借助戴尔服务,谋求发展
DHMRI在2008年建立数据中心时,当时还可以在一块新地皮上部署设施,但需要尽快将数据中心投入运行起来,可是IT人手又有限。Burke说:“作为一家新成立的研究所,我们正好有大好机会,可以从头开始建立我们的计算架构和基础设施,现场没有任何遗留设备。我们没有人手来自行部署,于是就利用戴尔部署服务来补充现有的人员。”
DHMRI与戴尔咨询服务公司一起,规划建立一个虚拟化环境,运行在配备英特尔至强处理器的戴尔PowerEdge M600刀片服务器上。这些服务器放在戴尔PowerEdge M1000e刀片机箱里面,支持两个全然不同的域。
Burke说:“我们有构建架构,以打印和文件服务、会计及其他后台应用程序支持我们的用户群,这个环境大部分采用VMware Infrastructure 3进行了虚拟化处理。另外我们又有研究架构,用思杰XenServer进行了虚拟化处理。戴尔咨询服务公司帮助我们从头开始建好了构建环境,并且按照非常好的实践,部署了微软Exchange和活动目录。正是由于使用戴尔服务,我们得以在两个月内部署好了一套可靠的基础设施——速度比我们自己部署要快得多。”DHMRI通过戴尔买来了VMware软件。
作为一家技术型研究机构,DHMRI每隔两年就要更新硬件。为了简化这个过程,该研究所通过戴尔金融服务公司来租用戴尔设备。Burke说:“两年下来,我们的机器磨损得很厉害;于是我们觉得可以向戴尔租用设备,还可以使用最新的下一代技术。我们的工作重点之一就是,使用最新技术来处理我们的计算密集型任务,而戴尔金融服务公司为我们提供了这种便利。”
通过知识促进健康
投资于DHMRI让Murdock先生引以为豪,研究资金得到了明智的运用也让他备感欣慰。
Burke下结论说:“到头来,这个研究中心的目的是,把所有这些不同的数据整合起来,为科学家们评估涉及不同学科领域的数据提供一个平台。这个新的知识库将最终直接促进人类健康。”