【IT168 专稿】曾经,塔式服务器和机架服务器主宰服务器市场,但是随着企业数据中心空间越来越稀缺,电力成本不断攀升,虚拟化应用增多,刀片服务器日渐成为企业应用的的新趋势,自2001年进入大众视野,刀片服务器便被众多厂商和企业看好。IDC预测,到2012年,刀片服务器交付量在所有服务器交付总量中的比例将超过25%。云计算向企业数据中心提出了更高的要求,因为具备高密度、适合虚拟化、节能高效的特点,刀片服务器被视为部署云计算的非常好的平台。
但是,在向一个刀片机箱中插入刀片服务器时,我们必须先确定可靠性和标准性的问题,因为在追求高密度运行的同时付出可靠性的代价显然不是明智之举。纵观刀片服务器市场,笔者认为,标准和价格是阻碍刀片服务器推行的两大障碍,由于各大厂商产品标准不一,价格高昂,让很多企业只能望“刀”兴叹。而唯有注重可靠性、统一标准的产品才能具有更大的发展空间和更强的市场渗透力。
作为行业领军,IBM的刀片系统可谓是最业界最全面的标准体系,用户五年前买的IBM刀片服务器现在仍能插到最新的刀片机箱中,这样也很好地保护了企业的投资。除了注重标准,在可靠性方面,IBM刀片系统也毫不含糊,通过集成服务器、存储和网络,IBM BladeCenter已经帮助各个行业的公司解决复杂性问题。在IBM成立百年之际,IBM BladeCente推出贯穿全年的“TRUST信刃之旅”五项免费服务活动,涵盖了免费测试、服务响应、服务升级、免费装配到认证培训五个方面,旨在让更多的企业了解使用IBM BladeCenter刀片服务器,将BladeCenter的可靠品质传递到更多的企业中。本文从技术的角度解析支撑BladeCenter高可靠品质的来源。
加固机箱采用多项冗余设计
因为体积的限制,刀片服务器不具备电源和风扇,这些组件往往集成到机箱中。由机箱来为所有刀片服务器提供电力、制冷、网络端口和其他互联组件。因此,机箱是刀片系统中重要的一部分,坚固耐用的机箱是系统持久运行的保证。IBM有5种机箱可供选择,每种机箱都具备特殊的强化功能,比如BladeCenter S机箱是一种小型、入门级的机箱,能够与其它机箱实现兼容和互操作;BladeCenter E机箱拥有最大的密度,灵活性非常高,并且拥有业内最高的能效;BladeCenter H机箱不仅具有BladeCenter的所有功能,而且增加了对高速网络和更多IO端口的支持;政府/军队或电信等行业如果需要加固机箱,可选择BladeCenter T,该机箱专门面向这些环境做了特殊优化,从而保证恶劣环境下的持久运行;下一代BladeCenter HT是一款高性能的加固电信平台。(详情可参考私有云基础架构之机箱篇)
除了特殊的加固,IBM BladeCenter机箱的高可用性还体现在多项冗余设计上,IBM BladeCenter继承了大型主机的成功设计经验,所有机箱背板、电源、散热、连接通路、IO模块等均采用冗余设计,并能够对机箱内的环境条件和每个刀片进行监督,在出现异常情况时,向系统管理员发出报警。为了减少故障, BladeCenter机箱的冗余设计体现在以下几个方面:
首先,每个刀片与机箱之间的数据连接和电源连接是冗余的。由于技术限制,大多数刀片服务器在I/O、电源方面还未实现冗余设计,如果一个连接器出现故障,都可能影响整个刀片系统,因此在连接通路上,冗余对于高可用性很重要。如图,IBM所有刀片机箱上都提供两条I/O和电源连接线。
▲
其次,实现了直流电源域的冗余。多数刀片机箱的电源模块在经过交直流转换以后都连接在一个直流总线(域)上面,这样当这个直流电源域出问题的时候(比如短路导致熔断),整个机箱就会失去供电。而IBM的直流电源域也是双路的,分别连接在不同的电源模块上,这样无论是一个电源出问题,还是一路直流域出问题,都不会影响机箱的正常供电。
最后, IBM刀片系统采用N+N模式的电源设计思路,每个刀片服务器连接两个独立的电源,单点故障不会使整个机柜断电,在最大程度上做到了电源可靠性。一些刀片服务器在电源设计上仍采用N+1结构,意味着任何单一个电源故障都需要由“备用电源”进行故障切换,但是由于设计是单一线路的,即使是出现一个电源缺陷,也会使整个线路不能工作。
IBM BladeCenter系统管理方案
除了I/O和电源的全冗余设计来保障可靠性,降低宕机时间外,IBM刀片系统集成了其他的先进功能以保证系统的可用性。Calibrated Vectored Cooling(矢量冷却技术的)的热插拔供电和冷却,拥有专利的散热孔,使得系统更稳定、更节能;特有的光通道诊断快速定位故障点,预警式错误分析:可在主要部件损坏前48小时提出预警;业界创新 ServeRAID VAULT adapter 可帮助数据加密。
▲BladeCenter高级管理模块
BladeCenter具备高级管理模块。每个BladeCenter机箱都标配一个高级管理模块AMM(BCT为管理模块MM),并可以升级为2个以支持冗余(BCS最多一个AMM)。管理模块为解决方案提供单一控制点,支持众多行业标准和开放协议。AMM提供系统管理功能包括:基于Web的带外控制;虚拟软盘和CD-ROM支持;Windows“蓝屏”错误捕获;LDAP和SSL支持;为机箱和机箱内安装的组件进行视频、文本、键盘和鼠标远程重定向,高级管理模块提供全本地和远程服务器管理,无论网络状态如何,都可以访问刀片服务器。
▲BladeCenter Open Fabric Manager 3.0界面
除了硬件管理模块,在软件方面,凭借预先配置的连接和简便的图形用户界面, BladeCenter Open Fabric Manager可以智能地管理刀片和存储与数据网络之间的交互,从而实现刀片部署的自动化。只需定义一次连接, BladeCenter Open Fabric Manager便会自行处理之后的连接, 凭借自动故障转移功能, BladeCenter Open Fabric Manager还有助于缩减代价昂贵的停机时间,实现跨BladeCenter系列的机箱和交换机工作。
不容忽视的SSD读取、虚拟化
作为非常好的业务实践的一部分,IBM倡导使用集中放置的共享存储器。传统硬盘驱动器的替换数量高达组件总替换数量的20-50%,通常被设计成能够转动的平盘并带有可从机械上移动的读/写磁头,这些可移动的部件提高了故障发生率并延长了存取时间。IBM提供全新的固态驱动器(Solid State Drives)帮助在刀片服务器上从本地托管映像。固态驱动器的可用性高达传统的旋转磁盘的三倍,性能可靠,甚至无需热插拔硬盘驱动器,从而让业务始终保持正常运行。
在虚拟化方面,BladeCenter的虚拟化功能允许创建高度灵活的基础架构,快速、轻松地适应业务变化。BladeCenter具备完善的虚拟化解决方案,它也是业界唯一允许在单一平台上整合和简化Linux、UNIX、IBM i操作系统和Windows工作负载的刀片服务器解决方案。
小结
随着云计算的发展趋势愈演愈烈,在构建高密度计算、高度虚拟化的云计算数据中心方面,刀片服务器是当之无愧的“潜力股”,其发展势头正以迅猛的姿态持续增长。
▲IBM BladeCenter HX5
经过多年的积累,IBM开发了业界非常好的业务实践来简化IT环境提供高可用的刀片服务器平台。与IBM Systemx服务器一样, 许多BladeCenter服务器也基于IBM X架构构建, 以确保企业级的可靠性。基于eX5架构最新一代IBM BladeCenter HX5发布之初就集成了英特尔至强7500新加入的小型机RAS特性,此外,它还具有OnForever高可靠技术做保障,通过IBM MAX5内存扩展技术,先进的光通路诊断,错误处理和全天候远程访问管理等功能有效简化系统管理,最大限度地减少停机时间,增加系统的可靠性。