服务器 频道

国产高性能计算机急需构建统一标准

    【IT168 专稿】2002年以来,随着中低端服务器利润的进一步快速下滑,国内外各大服务器厂家开始寻找新的利润增长点。技术水平要求高、市场进入比较困难、利润相对比较高的高性能计算机市场成为这些厂商争夺的新的制高点。这些服务器厂商包括IBM、HP、SUN、DELL、SGI等等,由此在高性能计算机领域一场由国外服务器巨头和国内曙光、联想、浪潮等企业组成的战国逐鹿时代正式拉开序幕。

    曙光4000A在2004年全球TOP500排名第十的成绩标志着我国民族高性能计算机产业取得重大突破,以曙光为代表的中国高性能计算机产业的崛起,不仅在市场上有效遏制了国外品牌的竞标价格,而且有力地促进了国内高性能计算力量的发展与竞争,拉动了我国高性能计算应用的升级,推动了我国高性能产业浮出水面。

一、标准之战已经打响

    然而,我们也必须要看到竞争的形势是异常残酷和危险的。当前国外服务器企业正在抓住高性能计算机产品升级换代的时机,抓紧制定和推出其自身的高性能计算机标准,从而打造从芯片、操作系统到基础架构、存储、交换、应用等全方位产业生态链,其中比较典型的产品就是刀片式服务器。

    对于IBM,HP等国外大公司来说,在没有标准的情况下,他们起步早,技术实力和资金雄厚,可以独立开发整个刀片式服务器系统。国内客户在选择刀片式服务器产品时,出于保护投资等方面的考虑,在产品互不兼容的情况会更愿意倾向选择IBM等大公司的产品。目前IBM 联合Intel公布了部分刀片式服务器设计规范,包括一些技术细节信息,但是根据这些信息无法重新复制整个系统,而且其关键的技术接口规范并没有向外界开放。这样,根据该规范只能设计和生产刀片服务器部件,IBM则可以牢牢控制整个刀片式服务器产业链。

    而对于国内服务器厂商而言,技术实力、资金以及品牌知名度都远不如跨国IT公司,同时在刀片服务器市场上起步较晚。在这种情况下,如果不制定并执行统一的行业标准,如果还是各自为战,闭门设计整个刀片服务器系统,则国内服务器企业根本无法同国外服务器企业竞争,最后只能沦为永久OEM其他国外服务器厂商产品进行贴牌销售,或沦落为仅仅设计并制造其它国外服务器厂商刀片服务器系统的组件。长期下去,中国的民族服务器企业必将失去技术话语权,中国的服务器产业也必定消亡!

    所以,只有国内服务器厂商采用统一高性能计算机标准,成立高性能计算机产业联盟,吸纳芯片厂商、操作系统厂商、交换存储厂商、基础架构厂商、高性能计算机用户等产业链上下游企业及用户单位,成立中国高性能计算机标准工作委员会,设计并制定高性能计算机各模块标准,才有可能在未来几年与国外服务器企业抗衡,并在国内服务器市场占有一席之地。

二、国内外高性能计算机标准发展现状

    目前来看,国内外还没有一个得到业界主流厂商全面支持的高性能计算机产品标准,各个企业或行业标准组织在高性能计算机领域制定的各类规范都还未形成全面推广的局面,这种现象在刀片服务器产品方面尤为突出,由于目前各个标准在刀片式服务器一些关键模块的物理特性上(例如:刀片的物理规格)存在差异,导致现有的各个标准之间很难融合,企业在现阶段采用其中任何一个标准都会由于标准的不确定性给企业的产品设计带来较大风险。由各个服务器企业主导的相关服务器规范,由于企业间存在的利益冲突,一方面难以实现各规范之间的融合与统一,另一方面也会造成对后来者的限制与障碍。这将给服务器企业和用户带来很大的风险,也将给整个产业的发展带来不利因素。

1)ISO/IEC/ITU国际标准组织标准

    根据对相关标准组织的查询,目前在ISO、IEC、ITU三大国际标准组织中,尚无系统化描述高性能计算机的标准和标准组存在,但由于高性能计算机当前是对机群、小型机、高端IA服务器、刀片式服务器等产品的泛称,是一整套各类IT技术的整合体,在当前各类高性能计算机的产品形态和相关标准中,大量采用了ISO/IEC/ITU标准体系中各功能子模块的技术标准。比如IEC60297标准族作为描述刀片服务器系统机械结构尺寸的标准,是所有刀片服务器标准的共同基础。其它受到引用的ISO/IEC/ITU技术标准包括:光纤传输标准、以太网传输标准、Infiniband传输标准、IDE磁盘驱动标准、SATA磁盘驱动标准、SAS、RAID、iSCSI、PCI / PCI-Express 总线标准等等。

    由于上述标准是各类计算与通信类IT产品的基础技术标准,在现存的高性能计算机系统中均加以采用,因此这里不做具体描述。在ISO/IEC/ITU标准中当前尚未形成特定的针对高性能计算机的技术标准组。

2)行业标准组织标准

    基于高性能计算机市场的巨大空间以及目前高性能计算机产品的复杂多样性,目前业界已经成立了多个面向高性能计算机产品的行业标准组织,这些标准组织由整机制造商、芯片制造商、通信厂商、系统集成商等共同组成,旨在为新兴的高性能计算机市场如刀片服务器市场、机群市场建立统一的产品设计标准与性能指标,从而带动相关企业的合作互惠。(参见附录:目前在高性能计算机领域具有较大影响力的行业标准组织及其相关标准)
 
3)企业标准

    除上述高性能计算机相关的行业标准组织外,全球各大服务器厂商都设计了自己的高性能计算机产品及相关企业标准,其中包括相关企业自己的刀片式服务器标准及规范、监控管理标准及规范、存储交换标准及规范、机群操作系统标准及规范、虚拟化技术规范等等。

三、如何制定我们的统一标准

    可见,目前国际上尚无统一的高性能计算机标准,各大厂商都在推广自己的标准。现在这个时候正是建立中国高性能计算机标准的大好时机。加快高性能计算机标准化工作对中国高端高性能应用领域计算机国产化具有深远的意义,这不仅关系着民族产业的发展,更关系着国家信息应用的国防安全,意义深远。

     中国高性能计算机标准的制定可在中国市场内形成统一的产品标准,实现产品的规模化生产,避免产生垄断和技术壁垒,从而促进整个中国服务器行业的技术创新和发展。高性能计算机标准将囊括从体系架构、操作系统、交换存储、安全、基础架构、刀片式服务器、个人高性能计算机、高性能计算机应用等诸多方面,涉及诸多底层技术与应用技术,且与应用需求密切相关。

    为保彰未来高性能计算机标准的顺利制定,高性能计算机标准制定一定要遵循循序渐进的原则,从最关键的领域、最迫切需要制定标准的领域、最容易出成果的领域入手(比如首先拟定中国的刀片式服务器标准),再扩展到体系架构、存储交换、操作系统等高性能计算机产业链诸多核心环节。同时在中国高性能计算机标准制定中,未来的标准工作组可与其它相关国际标准组织积极沟通合作,在坚持中立开发的原则下,吸纳其它标准组织的工作成果,完善中国高性能计算机标准,从而使其具有更广泛的推广基础。

    肯.凯西曾说过,“有时候我们无法等待某个人。现在,你要么在车上,要么没上车。”高性能计算机标准对中国高性能计算机产业意义深远,如果我们现在还没有上车,我们可能要永远错过这躺开往春天的地铁,并且将滑向民族服务器产业萧条的寒冬!

(本文作者系中国高性能计算机标准工作委员会筹备组秘书长)

附录:高性能计算机行业标准简介

1) PCI工业计算机制造商协会(PICMG)与CompactPCI标准

    PCI工业计算机制造商协会(PCI Industrial Computer Manufacturers Group)PICMG (http://www.picmg.org)成立于1994年,主要工作目标为各类嵌入式计算机系统研制通用技术标准。由PICMG制定的PICMG2.0标准,即CompactPCI标准定义了一种基于背板连接的计算机系统和I/O系统的标准。

    CompactPCI标准由于其自身存在的一些局限,未能很好的满足刀片服务器设计的需求,各厂商在设计产品时,根据不同应用领域对服务器性能、功耗、功能等方面的不同要求,在CompactPCI标准的基础上进行变化,衍生出不同规格的刀片服务器产品,这些产品只与CompactPCI标准保持部分兼容;加之CompactPCI标准本身1.0版与2.0版之间也互不兼容,从而导致当前刀片服务器各厂家产品互不兼容的局面。

    2001年PICMG开始制定面向下一代高性能计算与电信应用服务器的PICMG3.0标准,这一新标准的名称为“先进通信计算机构架(AdvancedTCA)”,简称 ATCA。

2)BladeCenter 联盟与BladeCenter标准

    BladeCenter联盟(http://www.blade.org/)主要由IBM与Intel构成和主导,联盟的基础为IBM eServer BladeCenter刀片服务器规范,与其它技术标准组织不同的是,BladeCenter联盟的主要工作目标不是建立一个由多家企业共同参与制定的中立产品标准,而是专注于对IBM eServer BladeCenter服务器规范的推广与合作伙伴培养。

    目前这一联盟已经吸引了包括CipherOptics、思科、Nominum、Nortel、Nokia、QLogic、SANRAD等在内国际知名厂商的支持。IBM 更是在2006年获华登国际1亿美元的风险投资用于未来五年内BladeCenter体系的合作伙伴发展基于BladeCenter标准体系的刀片服务器及其解决方案推广。

    厂商基于BladeCenter联盟制定的设计规范,可以设计包括网络应用、存储、交换等类型的刀片,目前BladeCenter联盟不对外开放背板与控制部分的接口与规范。

3)分布式管理特别工作组(DMTF)与SMASH服务器硬件系统管理框架

     服务器硬件系统管理架构(SMASH)套件是由分布式管理特别工作组(DMTF)公布的一套对高性能计算机进行管理的技术规范,其核心为SMASH命令行协议(CLP)规范。SMASH CLP独立于机器状态、操作系统、服务器系统拓扑结构及访问方法,可简单、直观地管理数据中心内的异构服务器系统。

    其最初由英特尔、戴尔、IBM以及HP等4家公司于2003年12 月发起,该框架协议对网络中服务器的寻找、配置和管理等界面进行定义和规范,以帮助独立软件开发商(ISV)和系统管理员编写可兼容各种硬件的服务器管理软件系统。除工作组的四家发起厂商外,目前AMD和Sun也对这一标准表示支持。SMASH的网址为:http://www.dmtf.org/standards/smash/

4)IPMI标准及规范

    IPMI规范是由Intel、Dell、HP和NEC为了降低服务器管理系统的开发成本及管理成本,并解决不同异构服务器信息融合等问题而共同制定的规范。

    IPMI标准 (Intelligent Platform Management Interface)由三部分组成:智能平台管理接口、智能平台管理总线(IPMB)、智能机箱管理总线(ICMB)。IPMI规范定义了管理软件和机箱管理硬件的接口。IPMB规范定义了内部智能平台管理总线。ICMB规范定义了IPMI使能系统的外部总线。IPMI规范的网址为:http://www.intel.com/design/servers/ipmi/index.htm 。

0
相关文章