服务器 频道

浪潮天梭K1:将国产服务器推向新高度

  【IT168 专稿】国产服务器产业发展可概括为“发展中阶段”和“趋向成熟阶段”。相对国外知名品牌来说,国产服务器的发展起步较晚,技术水平较低,在芯片等核心技术的把握上也不尽如人意。国际厂商把持大部分市场,国产厂商无自主知识产权,较少增值价值。种种现实将国产服务器挤入了狭缝之中。

  想要扭转这一现状,不能一味的在中低端市场厮杀,而是要将矛头指向服务器产业的制高点。高性能计算与关键应用主机就是服务器产业的制高点,产业要发展起来制高点就必须要占领,浪潮集团也围绕多路服务器、高性能计算及关键业务应用领域进行突破,全面实施高端布局。

  从应用的领域来看,关键应用主机与高性能计算机有所不同,高性能计算机主要面向天气预报、核试验的模拟、油田的设计等领域的科学计算,考验的是平台单位时间内的运算能力;而关键应用主机则是承载国家命脉性产业核心应用的支撑性装备,更加强调其联机事务处理能力,强调主机单位时间内处理交易的次数,考验的是平台的实时性和高可用性。关键应用主机的性能将直接影响社会经济运行的状况,所以具有更加现实的经济、社会意义和战略意义。

  从形式上看,高性能计算是几百、几千、几万台机器共同完成一个任务;关键应用主机是用一台机器完成每分钟几百万笔的交易;从技术上看,高性能计算机可能更关注它的浮点计算能力,大型应用主机整体能力是比较均衡。计算能力不仅仅是浮点计算的能力,IO能力,包括存储的速度和网络的速度,因为运行的业务的关键对系统的可靠性要求比较高,我们不希望电信系统因为关键应用主机而停掉,我们不希望铁路和民航的售票,因关键应用主机出现故障而宕机,所以对系统的可靠性可用性是比较高,一般要求永久的可行性。

  那么现在国内高性能计算和关键应用主机市场现状到底如何呢?“天河一号”和“天梭K1”就是高性能计算与关键应用主机的非常好的代表,将国内服务器产业推向了一个新高度。

  浪潮“天河一号”高性能计算的突破

  2009年10月29日,国防科学技术大学对外公布,中国首台千万亿次超级计算机系统--“天河一号”在该校研制成功,中国成为继美国之后世界上第二个能够研制千万亿次超级计算机的国家。

  “天河一号”突破了多阵列可配置协同并行体系结构、高速率可扩展互连通信、高效异构协同计算、基于隔离的安全控制、虚拟化的网络计算支撑等一系列关键技术。其系统峰值性能达每秒1206万亿次双精度浮点运算,内存总容量98TB,点点通信带宽每秒40Gb,共享磁盘容量为1PB,具有高性能、高能效、高安全和易使用等特点。

  超级计算机是世界高新技术领域的战略制高点,各大国均将其视为国家科技创新的重要基础设施,投入巨资进行研制开发。“天河一号”的问世是中国高性能计算机技术发展的又一重大突破,是国家和军队信息化建设的又一重要成果,为解决中国经济、科技等领域重大挑战性问题提供了重要手段。

  浪潮“天梭K1”关键业务应用的突破

  2013年1月,中国知名台关键应用主机天梭 K1系统正式上市,该产品是十一五期间国家863计划重大专项“高端容错计算机研制与应用推广”项目成果,由460名工程师历时4年研发成功,并在建设银行新疆区分行替代国外小型机,实现成功应用。该产品的上市标志着中国成为全球三个掌握最新关键应用主机技术的国家之一,实现了国家信息化建设核心装备的自主可控。

  浪潮天梭K1在关键领域的应用如金融(新疆建行、邮政储蓄银行总行)和电信(北京移动)都有应用案例,事实证明浪潮天梭K1在性能和稳定性上通过了严苛的考验,为关键业务提供了核心技术,也改变了行业应用中没有国产设备的局面。更多的应用案例使更多的人了解到了天梭K1的高稳定性和安全性。

  根据国家863计划重大专项“高端容错计算机研制与应用推广”项目成果,浪潮天梭K1在研发过程中取得了5大技术突破,下面我们就从技术角度解读浪潮天梭K1的诸多特性。

  多处理器CC-NUMA体系结构与处理器协同芯片组

  浪潮天梭K1的处理器和芯片组是计算机的两项核心技术。芯片组负责将处理器之间以及处理器和内存、I/O等其他模块链接,是计算机内部I/O的“主干道”.处理器通常被称为计算机的大脑,而处理器协同芯片组则是计算机的躯干和灵魂,决定了计算机系统整体扩展性和I/O等关键技术表现,在计算机领域称芯片组的设计为Core Logic,从字面的意义就足以看出其重要性。

  浪潮芯片组逻辑验证过程是艰难的,所运用的是FPGA技术,FPGA是芯片组逻辑验证的辅助技术。即现场可编程门阵列,是作为专用集成电路(ASIC)领域中的一种半定制电路而出现。芯片组完成逻辑设计以后,可以将逻辑模型“烧入”FPGA模型中进行验算,以检查和修正逻辑bug.

  从项目立项开始浪潮就一直向美国厂商购买FPGA模型,该厂商先后以各种理由推脱,不得已浪潮自己研制了FPGA电路。直至浪潮完成芯片组逻辑后,浪潮也一直没有放弃购买美方的模型(浪潮FPGA领域的经验较为缺乏,后期主要是想买过来后用作参考),但是报价不到20万人民币的FPGA电路模型,直到今天没有购买成功。

  浪潮K-UNIX成为我国第一款通过UNIX 03认证的操作系统

  UNIX03全称为Open Group UNIX 03认证,该认证是关键应用软件生态的入门牌。目前,UNIX仍然是关键应用软件的事实标准,不仅关键应用软件大部分是基于UNIX标准开发,而且关键应用软件在UNIX平台运行时间也最长、最成熟,因而,要开拓关键应用主机市场,打入Unix软件技术生态圈是必须的前提条件,但是该认证复杂大,门槛高,目前只有IBM、HP、苹果和Oracle四家厂商的产品通过了该认证。

  2007年银监会曾下发《证券公司客户交易结算资金商业银行第三方存管技术指引》指引,要求各参与方第三方存管系统的日处理能力应达到最近一年内银证转账最大日处理量的5倍以上,单次故障停机时间不得超过60分钟。而浪潮天梭K1系统每年非计划停机时间不超过3.2分钟,每分钟450万个并发事务处理能力业务提供了足够的弹性空间。

  多重容错技术体系

  浪潮天梭K1在芯片、模块、互联通信、硬件分区、虚拟资源、操作系统应用容器等6个层次都采用了故障诊断、故障隔离和自治愈、热替换、自动报警等多重容错技术,提供99.9994%的极高可用性,保证系统能够能够将故障自动诊断、治愈或者隔离,不会影响对外服务。此外,容错能力突出的K-UNIX与天梭K1构成了软硬一体化的高可用整体解决方案。

  异构平台互备运行技术

  天梭K1经过兼容性研究、系统平台/应用平台移植、基础性兼容测试、功能测试、性能测试、集成测试和异构平台互备运行技术研究,浪潮天梭与国外关键应用主机系统,搭建了双机互备平台,天梭K1在几个月的运行时间内,表现稳定,从“备机”逐步转换为“主机”,成功实现了业务系统从国外小型向国产关键应用主机的移植,以及与国外小型机的互备运行,为关键行业应用实现自主可控提供了稳妥的技术方法。天梭K1系统的应用示范是在新疆建行完成的,承担12个生产性系统稳定运行1年多时间,完全满足现有业务应用要求。

  千万门级超大规模电路设计

  天梭K1系统是一个庞大的研发工程,从芯片、到板卡,需要海量的研发工作量。全球第二个实现了600×500超大尺寸、20层高叠层、0.5%高阻抗控制精度的电路板的加工并稳定量产。天梭K1系统是一个庞大的研发工程,从芯片、到板卡,需要海量的研发工作量。先后研制大规模芯片数十个。特别是处理器协同芯片,这是计算机中唯一复杂度可与处理器相比的芯片部件,浪潮研制的芯片组集成了4.5亿个晶体管,有2577根管脚,而intel最高端的通用处理器至强E7集成的晶体管数量也不过14亿个,针脚数只有1567个,如此数量、如此规模的芯片设计是国内十分少见的。

0
相关文章