【IT168 专稿】亿万富翁大卫•H•默多克(David H. Murdock)当初往北卡罗莱纳州研究园区注资5亿美元时,他的设想是建立世界上首屈一指的营养和疾病研究中心。这家公私合资企业旗下包括大卫•H•默多克研究所(DHMRI),当初设立这个公共慈善机构是为了支持北卡罗莱纳州研究园区从事开拓性的研究工作。DHMRI的总部设在北卡罗莱纳州坎纳波利斯,拥有世界上同类研究机构中最庞大、非常先进的一套科研设备,包括基因组学、蛋白质组学、代谢组学、显微镜学和核磁共振等领域的非常先进技术设备。
可靠的HPC合作伙伴
DHMRI从事的一些计算任务需要许多台计算机协同运行,以便在一段合理的时间内完成分析。为了满足对于高性能计算(HPC)的要求,该研究所求助于戴尔公司。DHMRI的信息科学主管Mark Burke说:“我们的HPC集群基于配备英特尔至强处理器的戴尔PowerEdge M600刀片服务器。我们的构建模块就是戴尔M1000e刀片机箱,我们知道这些刀片机箱会投入到生产环境中,长期得到支持。”
戴尔咨询服务公司与DHMRI共同设计的这个集群具有灵活性、模块化和可扩展性。Burke说:“当时,我们对于HPC集群的要求不是很明确——实际上我被告知,构建的集群要能够支持我们的科学家所能想到的任何任务。为此,唯一的办法是建立一个完全模板化的可以利用多个交换结构(fabric)的集群;视任务类型而定,可以将交换结构添加到集群上运行。”
DHMRI通过戴尔购置了集群的每一个部分,包括Mellanox的InfiniBand互连器件、Force10的以太网交换机和Platform Computing的集群管理器软件。戴尔部署服务只用三个星期就部署好了集群。
Burke说:“我们在建立这个集群之前考察了好多家供应商;我对于戴尔的要求是,我想要一家供应商来负责所有方面。那样,如果我的集群遇到了问题,只要打一个电话就行。结果,我们对于设备和戴尔支持服务都非常满意。”
需要速度
HDMRI的任务之一是提供基因组分析,那样该园区的不同研究小组就可以利用分析结果。DHMRI使用专门的基因组测序仪器和基因分析软件来生成原始数据,然后把该数据处理成一种易于使用的格式。测序过程目前每星期生成约5太字节(TB)的原始数据。如果使用测序仪器供应商销售和推荐的服务器解决方案,分析原始数据大概需要五天才能完成——这个速度对Burke来说不够快。
他说:“我们需要能够在最短的时间为向客户提供最高质量的数据。于是,我们决定不购买那家测序仪器供应商推荐的计算设备;而是使用配备英特尔至强处理器、运行红帽Linux的戴尔PowerEdge R900服务器,构建了一款解决方案。我们立即把处理其中一项任务(分析数十亿个DNA碱基对)所需的时间从5天缩短到了38个小时。”
DHMRI的数据中心设备有相当一部分是戴尔产品,DHMRI统一采用了戴尔Latitude笔记本电脑和戴尔Precision工作站,以满足客户端的计算要求。Burke说:“我们更希望采用同类中非常好的的硬件和专业服务方案,而戴尔在许多研究领域满足我们的这一要求。”
满足最后期限
虽然PowerEdge R900端的处理时间得到了大幅缩短,但Burke想得到的不止这些。研究项目的最后期限日益迫近,于是他联系上戴尔公司,解释了需要更多的内存和功能更强大的处理器。戴尔工作小组立马提供了一款试生产的戴尔PowerEdge R910机器,该机器配备128GB内存(可扩充至1TB)和四个英特尔至强7500系列处理器,每个处理器有八核。
Burke说:“我更喜欢使用英特尔处理器。它们是稳固的平台,其架构又很适合我们处理的工作,即经常运行数百万次的运算。新款英特尔至强处理器的绝对计算能力和内部总线速度相当惊人。”
由于戴尔工作小组响应迅即,Burke得以满足了研究项目的最后期限。他说:“同样的工作在戴尔PowerEdge R900上要花38个小时才能完成,但在R910上只需要花22个小时,处理时间缩短了42%。于是,我们现在能够极快地获得处理结果。另外,我们只是从同一家供应商购买了第二台基因组测序仪器,而由于R910具有高性能,我们不必购买第二台服务器来分析数据。一台R910就能处理这两台仪器的结果;我们将来能够扩充内存,以满足更复杂算法的需要。我们还会改变R900的用途,将它用于另一个研究领域。”
更多HPC信息请关注:高性能计算社区