【IT168 专稿】作为IBM第五代企业级x86服务器的主打架构,eX5系列产品一改上一代eX4系列高高在上的态势,开始向双路和刀片系统下移使得市场对于这一代产品充满了更多期待。2010年底,我们特地总结了eX5架构服务器的五大创新技术,作为x86服务器的前言技术标杆拿出来回顾。以期通过揭示eX5产品的技术特色,展望未来x86服务器产品的发展方向。[点这里查看eX5破除x86服务器的6个旧观念]
eX5创新之一:MAX5内存扩展技术
内存是虚拟化、云计算和数据库等应用的关键瓶颈,但现有的X86服务器架构却限制了内存的扩展。以至强7000系列处理器为例,虽然每一代处理器的内核、缓存、主频,甚至微处理器架构都有发生变化,但每个内核所能访问的内存DIMM数却相当保守,如下表所示:
处理器 | 至强7100 | 至强7300 | 至强7400 | Nehalem-EX |
发布年份 | 2006年 | 2007年 | 2008年 | 2010年 |
每CPU内核数 | 2个 | 4个 | 6个 | 8个 |
频率 | 3.4GHz | 2.93GHz | 2.66GHz | 2.26GHz |
内存DIMM数/核 | 2个 | 2个 | 4/3个 | 2个 |
由于英特尔在Nehalem处理器中开始集成内存控制器,这可以大幅提升性能,但对于内存扩展也带来了一些新的挑战,比如扩充内存先要添加处理器,远端内存的访问性能显著降低,在某些情况下必须使用昂贵的大容量内存。为此,IBM对X86服务器架构进行了大胆的创新:将内存从传统的与服务器处理器紧密捆绑的局限位置中解脱出来,让内存的扩展可以独立于处理器!其方法就是eX5架构中最重要的一块:MAX5内存扩展技术。
IBM MAX5内存扩展单元,上有32个内存DIMM
现场展示的MAX5内存扩展单元
MAX5的关键技术就在于这个散热器下面的eX5芯片,其中包含内存控制器和探听过滤器
MAX5内存扩展带来的好处是显而易见的:支持的最大虚拟机数量是竞争产品的两倍,支持更高的数据库性能,提高服务器利用率,允许用户用更便宜的内存硬件来满足特定内存容量需求,这么多的内存可以灵活发分配给多个CPU使用或者汇聚成一个内存池,软件许可证费用大大减少,另外,由于MAX5芯片中还集成了探听过滤器,可以更好的管理多个CPU内存与多个内存之间的数据冲突和延迟,提高内存访问性能。
比如,一台双路的x3690 X5机箱里本身就可以支持上下两块带有16个DIMM的内存板,即共有32个内存DIMM,如果再配上MAX5内存扩展单元(上有32个内存DIMM),即一台x3690 X5最终可以扩展到64个DIMM;而如果通过QPI线缆将两台x3690 X5连在一起,形成四路系统,总共内存DIMM数就可以达到128条!
eX5创新之二:eXFlash固态存储子系统
在一个向上扩展的多核系统中,数据存取的层次是CPU、缓存、内存、硬盘,越往外层,I/O越慢,因此,随着CPU的核心数量越多,CPU喂不饱的现象会更加严重,I/O因此成为多核计算之路上最重要的因素。
光解决了内存问题还不够,磁盘I/O也得跟上。eX5架构的第二大创新就是用更快的固态硬盘技术(SSD)来取代传统的机械硬盘。不过,跟其他厂商不同的是,IBM在eX5架构中不是简简单单把普通硬盘换成SSD硬盘了事,而是重新构建了一个包括8块SSD硬盘和带RAID功能的控制器在内的存储子系统,IBM将其命名为eXFlash。
如上图,在x3850 X5中,一共提供了8个硬盘位,可以支持8个2.5英寸的SAS普通硬盘,也可以插16个1.8英寸的SSD,甚至可以混搭使用,在不同硬盘上跑不同的应用。
eXFlash能带来什么好处呢?比如,某企业的业务部门需要30个100GB的数据库,每个数据库每秒要执行1.5万次I/O运算,即总的每秒要执行45万次I/O运算。如果用传统的机械硬盘存储方案,需要大量的硬盘,3年的硬件、管理 、电力和维护成本算下来要230万美元。显然,随着数据量的继续增长,这种方案很难维持下去。而如果使用SSD技术,由于性能可以提高几百倍,功耗只有1%,TCO成本可以节约97%。
eX5创新之三:I/O虚拟化
在比硬盘更远离CPU的网络I/O层面,IBM的eX5架构也进行了创新:I/O虚拟化。
过去,X86服务器可选的网络带宽是1Gb或10Gb,没有第三种选择,而且10Gb还远没有普及,但在使用了IBM的Virtual Fabric技术之后,可以将10Gb网络带宽按应用负载进行灵活分配,每个10Gb端口可以虚拟出4个虚拟端口,而且支持以太网和光纤两种不同协议,从而不仅可以提升应用负载或虚拟机的网络性能,也可以大大减少适配器、交换机、线缆等数量,从而节省成本。
eX5创新之四:IBM OnForever的可靠性
对于企业级服务器而言,无论是跑数据库、ERP等关键业务,还是用来做虚拟化整合,可靠性、可用性都是系统的生命。据介绍,IBM的eX5架构在这方面的价值主要体现在三个层面:
一是预测性故障告警,涉及CPU、内存、硬盘、风扇、电源和QPI线缆,通过监控分析这些部件的运行数据,将出错的风险扼杀在摇篮里。
二是多重内存保护技术,包括Chipkill内存(能够在DRAM模块发生故障后有效恢复正常运行)、Memory Protexion(在 Chipkill的基础上,还能纠正 DIMM上更多的位错误,以便提高数据的完整性)、内存镜像和内存备份(能够在发生不可纠正的内存或内存插槽错误时维护数据内容)、内存擦洗(通过内存梳理及时检测并恢复数据错误,提高系统的正常运行时间)。
IBM工程师在介绍x3850 X5上的内存单元
三是Node FailOver技术,两块刀片或两个机架服务器组成一台多路系统,可以扩展性能,当其中一块刀片或机架宕机,另一个系统可以接管应用负载,避免了节点层面的单点故障。
eX5创新之五:灵活扩展能力
虽然IBM此次只公布了三款产品,但借助FlexNode节点互联技术和MAX5内存扩展技术,可以进行非常灵活的组合,从而针对不同应用负载的需求,提供更有针对性的产品,具体如下图所示:
面向工作负载优化的扩展系统
工程师介绍将两个节点连接起来的QPI线缆
FlexNode技术让系统的分分合合更灵活