服务器 频道

高性能走下神坛,开启"平民化"运动

    【IT168 报道】在高性能计算上,曙光为中国树立了一个标竿:曙光4000A以每秒11万亿次运算速度的技术和应用双跨越,不仅成为国内计算能力最强的商品化超级计算机,使中国成为世界上第3个能制造10万亿次商品化高性能计算机的国家;而且在2004年6月全球高性能计算机TOP500排行榜中位列第十,在基于AMD芯片的超级计算机中,效率也达到全球先进。

    全球HPC TOP500排行榜每半年刷新一次。在刚刚公布的最新一期排行榜中,尽管服务于上海超算中心的曙光4000A已经从一年前的第10位下滑到第31位,但曙光已经向另外一个高峰发起了冲击:在7月12日曙光成立十周年庆典上,中科院计算所国家智能计算机研究开发中心和曙光公司宣布,正式联合研制每秒运算速度达百万亿次的新一代超级计算机。百万亿次超级计算机的突破,对于国家民族的战略意义勿庸置疑。但问题是,超级计算机只有商品化和普遍应用,这个产业才能获得持续的源源不断的发展动力。曙光系列超级计算机,是作为一个象征和标志束之高阁,还是通过应用找到广阔天地呢?

    曙光人的答案是:顶天立地。10万亿次、百万亿次是为了“在技术上顶天”,提高国家的战略安全和产业的技术核心竞争力;而把高性能计算拉下神坛,通过技术和市场使之走向平民化、深入行业细分应用,则是一种“应用上的立地”。顶天立地完整地体现了曙光对待技术也应用的辨证思维和平衡术。

普及高性能计算,曙光获得发展引擎

    十年来,在曙光“顶天立地”战略,以及“整合计算、细分应用”策略下,曙光服务器不仅在技术上获得了一系列的突破,与此同时,曙光提倡细分应用,产品从单一品种发展到天潮、天演、天阔三个系列几十种型号并逐步占领市场。目前,曙光高性能计算机已连续9年稳居国产高性能计算机市场卓越,拥有国产高性能机90%以上的份额,并在高性能集群领域实现了国产机对进口产品的超越。

    曙光 “整合计算”思想的指引下,先后成功开发了曙光DCMM机群监控系统、曙光DCMS机群管理系统、大规模KVM切换系统、智能千兆网卡、网格零件等用于整合计算资源的“粘合剂”,大大提高了曙光机的稳定性、可扩展性、易用性和可管理性,从而确立了曙光机的差异化竞争优势。从当初工艺粗糙的工程样机,到今天上海超算曙光4000A大半年只坏5个节点,数百台节点机平均无故障运行时间突破25万小时,产品的稳定性、好用性、兼容性和可靠性大大提升。曙光超级服务器的质量可靠性足以让国际巨头们瞪目结舌。而这种可靠性正是曙光在四路主板上实现自主设计的结果,也是曙光实行“大质量观”全面质量管理体系的产物。

    为了满足不同行业用户的个性化应用需求,曙光推出了“细分应用”的产品策略,针对石油、气象、生物等不同行业和领域推出了专用型高性能计算机。通过与众多行业用户进行联合研发、系统优化、软件并行、人才交流等多种形式的技术交往,逐渐深入了解了用户的需求与实际应用的特点。曙光推出的石油、气象、生物和教育行业专用一体化方案并取得了巨大成功,目前曙光在石油高性能计算领域占据了60%的份额,在教育行业已成为被广泛接受的“知名品牌”。

    把技术攻关的最新成果不断地转化为商业应用,不仅使许多行业用户受益非浅,而且也使曙光在研发,在企业发展上,获得了强大引擎,形成良性循环,逐步向更高更远迈进。


应用导向:避免高性能服务器采购误区

    事实上,曙光在高性能服务器市场上的成功,和客户、市场日益增长需求息息相关。随着信息化的不断深入,网络的日益普及,大型企业管理系统如ERP、SCM等建立,企业规模的日益壮大,使得对高性能服务器的需求日益强烈。与此同时,在应用需求推动下,高性能计算的技术架构也日益成熟,高性能计算的周边应用环境也日益改善,商业化、工业化、标准化的软件大量涌现,从另一个层面推动了高性能计算的平民化进程。

    但高性能计算毕竟是新生事物,企业在采购中,往往不可避免产生一些采购误区。最常见的误区是单方面追求高性能与计算峰值。认为只要能提供最快的计算效率就能满足企业的海量信息分析,满足其他计算处理。但如果高性能计算不契合应用,不与业务本身实现无缝连接,那么即使全球先进的计算能力也可能产生比较低的效能。

    另一个常见的误区是很多国内用户对于国外品牌的盲目崇拜。事实上,在一些细分领域,以曙光为代表的国产品牌已经在高性能计算领域积累了足以与其他国外品牌比肩的技术和产品。而且在服务、质量甚至有超越之处。比如,上海超算中心的曙光4000A节点机平均无故障运行时间突破25万小时,曙光服务中海油的由160节点构成的超级服务器,曙光的技术支持人员只用了4个小时就成功完成了调试。

    其三,认为高性能计算高不可攀,维护成本大,费用代价高。事实却恰恰相反。比如,由于曙光4000A拥有很高的质量可靠性,曙光仅安排了一名工程师常驻上海超算就能满足日常维护的工作量。超级计算机可同时进行几个作业,能实现每单位成本较高的持续性能,是一条既省钱又实惠的好办法。

    因此,在高性能计算采购上,正确的态度是,关注实际业务应用,而不是单纯的计算能力攀比;对中外品牌要有理性的态度,在技术、应用和服务上综合考虑。


高性能服务器推广年,曙光服务超越未来

    2005年,经过10年砥砺的曙光,在高性能服务器的平民化上更是攻势如潮,以专注和差异化对抗国外巨头,向客户提供差异化方案、附加值产品、个性化服务的独特价值。从服务超越战略到填补了行业空白的高性能计算实验室应运而生,再到高性能服务器平民化四项基本原则的确定执行......曙光不遗余力地把高性能服务器拉向普及。

    服务超越战略旨在把曙光在石油、教育等行业的成功经验与模式向更多的其他行业进行“低成本复制”,让更多行业的用户从中受益;而曙光高性能计算实验室的成立,以及随后推出的“用户方案免费测试服务”,很好地方便客户对高性能服务器的认识,一方面帮助客户测试应用软件在高性能计算系统上的可用性。另一方面是应用软件在原系统和机群系统上的性能测试比较,可帮助用户分析高性能计算系统在应用中性能究竟能提升多少,能带来多少价值。目前,已经有近二十个客户在该实验室进行了免费测试。在科学工程计算领域,主要包括Fluent计算流体力学软件、Abaqus计算固体力学有限元分析软件、Gaussian 2003分子动力学软件、石油地震数据处理软件、天气预报MM5和Grapes软件等。在信息服务领域,包括Oracle 10g数据库应用、VOD视频点播、负载均衡、高可用软件和网络游戏等。曙光这一独辟蹊径的做法,进一步推进了高性能计算走向普及。

    另外,在产品方案上,曙光已经形成了一套平民化的高性能计算机研发“四项基本原则”:(1)细分专用、应用导向:强调对应用非常明确的用户,研制针对性强的专用超级计算机,省钱又实惠。(2)两高两低、顶天立地:首先是高生产力价格比——不是实验室运行Linpack等测试程序反映出来的性能价格比,而是指单位成本、单位功耗、单位空间机群能提供给用户的实际生产力。其次是高可用,指计算机机群能像其他机械与电器设备一样长时间不停机地工作;两低是指低成本和低功耗。(3)工业标准、安全智能:通过网格钥匙、入侵检测、防火墙、专用网卡来提高安全性,同时进一步丰富网格零件、提升效率,更容易的管理监控、使用简洁方便。(4)分散集中、体系创新:分散与集中的矛盾是促进计算机技术发展的基本矛盾之一,网格技术要发展,高端计算机也要发展。从研发出发点上,曙光保证了高性能服务器的平民化潜质。

    可以预见,随着业务和规模的发展,越来越多的中国公司面临着一个又一个新跨越,而如何充分利用信息技术,使得自己如虎添翼,趋利避害?曙光的高性能计算平民化策略,无疑给予他们许多期待。


0
相关文章