在HPC系统普及阶段,客户的成长和转变十分迅速,浪潮高性能服务器事业部总经理刘军坦言,“以前能够提出这么专业要求的客户并不多,现在客户越来越理性,单靠linpack、浮点能力这些单纯的技术指标已经很难打动客户了,像西交大这样对HPC十分了解的客户会直接提出十分到位要求,有的甚至会具体到硬件参数配置,而一些非专业的客户则更为直接——跑实际应用看结果,这可以归结为一句话‘好用,用好’。”方案不是仅是硬件软件的简单堆叠,如果不经过优化和开发,非常先进的平台也可能只跑到二流水平。”一个大学的客户曾经说起过这样一件事,由于底层程序没有经过优化,两个节点的性能竟不如一个节点的性能强劲。
客户的转变对所有的服务器厂商都是一个挑战,也是一个机会。“一直以来,浪潮都以应用为核心,致力于为中国用户提供无缝贴合的高性能平台”,刘军说道,“对于每个客户我们都会有一个专门的方案,许多客户我们还专门做过个性化的开发。”
浪潮的方案——个性化开发
浪潮为西安交大构建了天梭TS10000高性能计算集群系统,并为其提供了高效的并行处理解决方案:浪潮天梭TS10000高性能计算集群系统基于最新的Intel四核平台技术的NF190D高密度计算节点,同时配备天梭专用集群机柜、天梭TSMM2.0管理软件、并行环境、编译器、数学库、作业分配系统等,整个方案的最大亮点就是系统加装了经过浪潮优化的Lustre文件系统。

浪潮天梭TS10000系统拓扑图
Lustre是一个开源的、基于对象存储技术的集群并行文件系统,它具有很高的可扩展性、可用性、性能、易用性等,理论上可支持10,000个集群节点,PB的存储量,100GB/S的传输速度,是下一代的集群文件系统。但是lustre系统,操作专业性强,使用困难,而且容易因驱动、系统及其他软硬件兼容性问题导致系统性能的大幅下降。浪潮专门做了大量优化开发工作,解决了系统的兼容性问题,使平台性能大幅跃升。
系统部署完成后,经过测试,磁盘读写性能提高了5倍以上,在几乎未增加客户成本的情况下,解决了一般集群系统无法克服的I/O瓶颈。
除此之外,这套方案还有两个突出优势:
首先,易于扩展,浪潮天梭TS10000高性能系统采用全新的开放体系结构和模块化设计,以交换为核心,将模块化的计算单元、存储单元和通信单元聚合成一个开放、易扩展的高性能系统,系统几乎可线性扩展,随着西安国家高性能计算中心业务量的不断增加,未来只需通过添加新的节点就可完成系统平台的升级工作,完全可按需部署。
其次,易于管理。随着系统的不断快速升级,西安国家高性能计算中心设备也飞速增加。如何在不增加过多人力的情况下,实现对服务器的轻松管理也是客户需要解决的问题。浪潮睿捷管理套件具有强大的远程管理控制功能,实时监测系统状态,能够通过远程IP登录进行跨网系统管理,这些高级管理功能提高了中心管理人员的工作效率,实现简易、轻松管理,有效解决了上述问题。
让客户“好用,用好”,浪潮已经取得了许多客户的信任,“成了买卖,也成了自己的品牌”。许多国内外知名学府已经成了浪潮的客户,清华、中科大已经反复多次购买浪潮天梭高性能系统。