服务器 频道

曙光机群系统助力中国河西化工机械公司

    【IT168 专稿】“1970年4月24日,中国在第一个火箭发射实验基地酒泉卫星发射中心成功发射第一颗人造地球卫星“东方红一号”,成为世界上第3个独立研制和发射卫星的国家,中国航天活动的序幕从此拉开。到2005年,中国已成功研制并发射60多颗人造地球卫星,完成由试验卫星向应用型卫星的转化……”这是新华社在“东方红一号”发射35周年之际发布的消息。中国河西化工机械公司正是这颗被誉为“中国知名颗自制地球卫星”的幕后研制者之一,是“东方红一号”的运载火箭第三级固体发动机的唯一研制单位。该公司先后共获得近300项科技成果奖,为中国航天走向世界作出了重要贡献。日前,中国河西化工机械公司与曙光公司强强联合,以曙光高性能计算机机群----曙光TC4000L为基础共同打造航天研制的高效平台。

一、项目需求分析:先进性、稳定性、可管理性以及可扩展性的全面要求

    中国河西化工机械公司主要从事固体火箭发动机的研究、开发、设计和环境试验等国家一类专业设计。多年来,他们既重视研究条件改善,又注重人才培养。在完善固体火箭发动机燃烧、热结构与内流场国防科技重点实验室的基础上,又对喷管推力向量控制试验室进行改扩建;各种先进的燃烧、流动和结构大型分析软件配套;建成了数字化网络信息中心,提升了设计手段和水平。河西化工机械公司网络信息中心的搭建对计算中心系统的先进性、稳定性、可管理性以及可扩展性四大方面有着很高的需求。针对河西化工机械公司所提出的技术需求,曙光方面做出了全面且极具指导性的回应,并且积极指导河西化工机械公司如何构建高性能服务器机群,解决服务器处理能力不足、计算规模小的问题。

    河西化工机械公司要求该系统必须易于扩展,具备灵活的升级空间——包括CPU数、I/O接口卡、内存、硬盘和多个系统扩展槽,以此为以后的系统扩充打下良好的扩展基础。在性能提升和扩展上,一方面需要系统能够支持未来更好的计算机技术,另一方面,还要支持机群计算技术,可以方便、灵活的进行系统性能的横向扩展,实现多台服务器的机群。当然,整个系统业必须具备高可靠性、可用性、可维护性和良好的兼容性,支持冗余、容错、热插拔等先进的服务器存储技术,在方便系统扩展的基础上,可以有效的避免网卡、电源、硬盘、风扇等的单点故障,更好的保证系统的工作。

    河西化工机械公司在此次设备采购中关注的重点包括:所选产品的品牌优势、产品质量、技术实力、成功应用情况等;设备的提供能力、技术支持、技术服务能力等;基于标准的、开放的技术和架构,在保证可靠性的基础上,具有强大的系统性能、稳定性、可扩展性、可管理性等,便于将来升级和系统维护、管理。经过以上指标的全面筛选,河西化工机械公司最终选择了基于AMD Opteron处理器的曙光TC4000L机群服务器系统来搭建工作站、硬件防火墙组件,搭建此次强大的航天应用平台。

二、项目解决方案:着眼应用 稳定可靠

    经过对河西化工机械公司的需求分析,为了提供稳定可靠的系统应用,曙光公司分别以两台16节点和8节点的TC4000L机群服务器承担起了硬件防火墙和工作站服务两项工作。

    曙光TC4000L系统是具有多年市场成熟度的产品,它具有很多独特的特点:混合平台的服务器聚集技术;系统监控、管理技术,采用跨平台、与OS无关的专用总线和底层通讯协议,监控硬件状态、监控系统配置、监控资源使用,采用监控通讯线和数据传输线隔离技术,充分保障可用性;是超级信息服务器和并行计算机的统一;具有逻辑视角的管理和监控系统。具有如此丰富的功能的曙光超级计算机可以提供强大的服务能力,而且从不同的逻辑视角可以对局域网中的服务器进行监控和管理。

计算节点:快速稳定

    考虑到河西化工机械公司的航天科研平台对于系统计算性能及可靠性方面的需求,曙光TC4000L机群采用了曙光天阔A620r-E服务器作为计算节点。

    该节点采用了2U机架式设计,独特的高密度机架式服务器散热结构设计,集高性能与高密度于一身,能运行Windows 2000/2003、RedHat Linux、Solaris x86、SCO Unixware、Novell Netware等多种操作系统平台,用户可以根据自己的需求在各种平台上构筑自己的网络及应用。为了保障极高的稳定性,系统节点机采用AMD64 Opteron双核处理器和AMD 8000系列芯片组,可提供800MHz~1GHz的HyperTransport总线频率和1MB高速L2 CACHE;同时,曙光天阔A620r-E服务器配置了8个DIMM内存插槽,最高可支持16GB PC2700/PC3200 ECC Registered SDRAM内存,内存带宽高达12.8GB/s,为系统提供了极为强大的计算基础。此外,曙光天阔A620r-E服务器还可提供高速PCI-X 133/100/66MHz插槽,并支持高速扩展设备,极大满足了系统节点的计算扩展需求。而根据不同的需求,曙光天阔A620r-E服务器还可集成双通道Ultra320 SCSI控制器,6块热插拔硬盘,作为存储服务器使用。


     对于系统而言,可靠性也是一个不可忽视的关键因素,在这方面,曙光天阔A620r-E服务器的高性能BIOS,有效提供了病毒保护和恢复功能。当个别硬盘出现故障时,其可选零/单/双通道SCSI RAID配置:RAID0/1/0+1/5/50,支持在线恢复RAID阵列,完全确保了数据的安全。其网卡冗余功能可保证系统在正常时分摊网络的流量,而当其中一块网卡出现问题时,系统还可自动将其负担的工作切换到其他网卡。在自动电源检测功能方面,系统可以随时检测内部直流电源的质量,发现问题及时报警。用户可以选择500W1+1冗余电源,确保更稳定可靠的系统电源。为了对系统进行有效的管理和实时监控,用户可以通过曙光智能硬件监控系统,配合机群系统及相应软件来进行。对于系统内部的温度、直流电源电压等工作状态信息显示,自动记录主机因故障停止工作的时间和日志信息,故障分析,网络唤醒等功能一应俱全。性能强大、稳定可靠、按需定制、方便易用是A620r-E最突出的特性,也是此次河西化工机械公司对新建系统的具体要求。

存储节点:高效可靠

    在本方案中的硬件防火墙机群和工作站机群,均采用了SAN模式构建存储系统,服务器和数据存储系统在结构上相互独立,直接将设备连接到FC集线器或交换机上,便于扩展系统规模、FC的传输速率,且拥有极高的可靠性,能够满足当前视/音频业务的需求。在该SAN模式存储系统中,所有的存储设备和存储数据均可采用中心化管理,整个存储系统也因此具有较好的可伸缩性,并且可以通过存储设备的机群方式而达到高可用度。

    这套全新的SAN模式解决方案是一种几乎拥有无限存储空间的分布式网络,非常适合作为存储系统的核心。它一改过去以服务器为中心的存储模式,以数据存储为中心,采用伸缩的网络拓扑结构,通过具有高传输速度的光通道直接连接方式,提供SAN内部任意节点之间的多路可选择的数据交换,并且将数据存储管理集中在相对独立的局域网内。这一解决方案的最终目标是实现在异构环境中最大限度的数据共享和可管理性。

工作站机群的SAN存储拓扑图

    目前,硬件防火墙机群系统的存储架构相对简单,日后可随用户对应用的继续发展而继续进行扩展。拓扑图中显示的是一台曙光DS2120FA光纤磁盘阵列,盘阵上的2个光纤主机通道与机群中2台提供存储服务的服务器直连。曙光DS-2120SA/FA系列磁盘阵列支持Serial ATA磁盘技术,这是目前最流行的磁盘技术。其外部主机通道为SCSI和Fiber Channel接口技术,内容12颗SATA硬盘;设计上,DS-2120SA/FA磁盘阵列为CableLess(无线缆连接)结构,可以根本避免诸如线缆脱落、信号串扰、线缆受热老化等问题。此次曙光DS-2120FA磁盘阵列于SAN环境的搭建,为用户带来更大的性价比,可谓一种非常好的选择方案。这种存储技术的前沿应用,不仅仅是性能的提升、功能的提高,同时也给用户带来了更经济的投资和更方便的管理。

    此次河西化工机械公司工作站机群则完全采用SAN存储区域网架构构建存储系统,由一台Brocade 3252 8口光纤交换机和1台曙光DS3140F光纤磁盘阵列构成,机群中每台服务器均配置1块HBA卡,具备了与SAN相连的基础。目前,采用这些设备构建的SAN不但具有2Gb/s的数据交换高带宽,还具有很强的可扩展性,其最大存储容量可以扩展到超过30TB的总容量,满足各种应用系统的需要,有效保护了用户的投资。

高可靠性、高可管理性、高性价比的全光纤磁盘阵列系统

    上图显示的是曙光DS-3140F/FA磁盘阵列。它是一款高可靠性、高可管理性、高性价比的全光纤磁盘阵列系统,专为存储整合和机群应用而设计。其模块化架构可以为多种"电子商务,随需应变"的环境提供灵活支持,允许存储容量随用户的需求而增长。作为一种高性能的光纤通道存储系统,曙光DS-3140F/FA磁盘阵列快速响应各种系统应用,提高事务处理速度和客户满意度。曙光DS-3140F/FA磁盘阵列的性能、容量以及数据管理和保护功能不仅可以满足当前用户的各种存储需求,而且对日后将要发生的存储需求同样支持。这台磁盘阵列共有4个2Gb光纤通道主机端口,直连UNIX和IA架构的机群服务器,经济合理地实现了多路径故障切换。利用其内建的4个光纤通道连接功能,可以减少或消除SAN交换机的需要,从而提高服务器机群的性价比。

机群其他子系统

    河西化工机械公司的机群系统设计采用了曙光TC4000L机群专用机柜。机柜中内置了导轨、托架等设备,能够将不同厂家、不同高度的19”标准设备准确内置其中,机柜中具有良好的布线设计,能够规范以太网、电源等走线以及机柜之间的布线。机柜中放置机群电源系统、主干交换机、内置控制台、机群监控系统等设备,精心设计的内部网络和电源布线,均采用就近插接,构造了整洁的机柜内部环境,极大地方便了用户设备调试和问题分析。布线系统按最大使用设计,机柜内部最大可为节点机系统提供60路交流电源接口和120路网络信息接口。

    此外,曙光机群电源良好的负载均衡设计也是该方案的一大优势:它能够使从端子排输入的多路双线电和三相交流电的各路(相)之间的负载通过机群电源系统后是均衡的,这种设计避免了机群中某一路(相)电的负载过重而跳闸的隐患。

曙光SKVM子系统图

    除上面各个节点外,曙光机群系统还为方案提供了电源子系统,机群管理软件、SKVM网络、I2C硬件监控网络、开发软件系统以及网络子系统等重要平台,保证系统运行的稳定性和平台的完整性。

三、案例成功总结:卓越性能 应用为本

    曙光TC4000L机群服务器为中国河西化工机械公司项目的搭建提供了极为强大的性能和令人信服的可靠性。系统通过对各个节点的设立,并进行点对点的应用服务极好的满足了河西化工机械公司的应用。中国河西化工机械公司项目课题负责人表示:“曙光TC4000L是一款既能进行高性能计算,还可以满足信息服务需要的高性能机群系统,对于我公司未来航空航天技术的发展起到决定性的推动作用。”

    曙光公司秉承发展我国高性能计算机产业化的宗旨,以坚定不移的信念和海纳百川的胸怀,开发推广具有自主知识产权和很强竞争力的高性能计算机产品,是目前国内知名一家拥有全系列品牌服务器的厂商。曙光4000L系列服务器则是企业级应用及数据库服务器的理想应用平台,其固有的强大的处理能力可以满足企业计算环境的任何需求,高可扩展性、高可用性、高可管理性和高可靠性有机地结合起来,并实现了多种超级服务器技术的下移,体现了国内厂商把技术优势转化为市场优势的产业化能力。

    此次在中国河西化工机械公司的成功应用是曙光成熟行业应用的又一高端领域应用。目前曙光的服务器应用于多个行业,并且已在在石油、航天、气象、生物、政府、企业IT平台、军队、科研教育等等领域拥有了较多的典型应用。

0
相关文章