对HPC的需求
在谈到中国传媒大学高性能计算中心的建立背景时,鲁永泉博士介绍道,一方面,随着数字高清电视的全面推广,原始视频超大的视频数据量对节目制作、播出、存储和资产管理等环节提出了新的需求——高宽带、大数据量的实时处理能力;另一方面,随着中国传媒大学向综合性大学转型,学校开展了大量基于高性能计算的科研项目,涉及到数字内容管理、视频图像检索、高清数字电视编码以及大规模电磁场仿真等研究领域。
在上述背景之下,中国传媒大学于2006年6月正式立项建设一个高性能计算平台。系统建成后不仅满足了传统大规模电磁仿真计算的要求,还为学校开展数字内容管理、视频图像检索、数字高清电视压缩编码、动画制作以及游戏设计等研究项目提供强有力的支持。
HPC系统选型和使用心得
“当初参与投标的品牌很多,国内外主流的厂商都参与了,各自都提交了方案建议书。我们也进行了认真的比较,并进行了相应的测试。”鲁永泉博士回忆道,在选择的过程中主要是基于大规模电磁仿真应用的测试结果,以及对于HPC方案的综合考量。
之所以会选择Dell提供的方案,鲁永泉博士指出主要出于两个方面的原因:一方面,当时最主要的一个应用就是大规模电磁仿真,这是一种纯数值计算类型的应用。测试结果表明,DELL公司推荐的“Intel 处理器+ Intel 编译器+ Intel数学库”方案在性能上具有较大优势。
另一方面,DELL公司提供的解决方案也是所有厂商中最完备的。在计算节点、消息交换网络、存储系统等方面考虑得比较周到,而很多其他的参与厂商的方案都是系统集成商提供的,在方案的可行性和合理性上有所欠缺。“尽管在招标过程中,DELL公司的报价并不是最低的,但我们依然选择了DELL。”
高鹏东博士补充道,国内高性能建设有一个通病:很多老师都过于强调硬件,甚至于只追求计算结点的数量,而忽略了网络、存储系统的建设,在软件方面更是如此,尤其是集群的管理软件。高鹏东博士表示,“戴尔的方案在提供管理软件的同时,还提供了后期的服务,如果没有这样的管理软件和后期服务,要使用这样的超级计算机,即使是对于计算机专业毕业的学生来说都很难,更别说非计算机专业的学生了。”
谈到系统的运转情况和使用感受时,鲁永泉博士用了一个很通俗的词来形容——皮实。“高性能计算中心的第一批服务器是成立初期购买的,至今已经5年多了。在这5年中,机房空调多次出现故障,导致机房温度高达50多度,甚至于主板上的焊锡都出现熔化的现象,但空调修复后,服务器依旧运转正常。5年来,所有DELL服务器的主要部件均没有出现过任何故障。实践证明,DELL的服务器还是很‘皮实’的。尽管第一批机器已经超期服役,但目前健康状况依然良好,还将继续为我校服务。”