【IT168 评论】今年3月初,IBM推出了其新一代X86服务器设计架构:eX5,即第五代EXA架构,并宣布从今年开始,这一原本用于四路以上高端产品的技术也开始下移到双路平台和刀片系统中去。IBM认为,其之所以能成为高端X86系统的市场领袖,与其过去十年坚持不断更新这一企业级X架构不无关系。不过,由于当时基于eX5架构的新产品没有正式供货上市,很多用户可能对此不甚了解。据悉,8月份,IBM全线X5产品就会开始供货,包括支持8颗处理器的x3850 x5,x3690 X5双路服务器以及HX5刀片服务器产品。
那么,eX5到底新在哪里呢?对传统的X86服务器又带来了哪些突破呢?日前,IT168服务器频道就此采访了IBM中国系统与科技部System x系列服务器品牌经理徐行。下面就让我们一起来看看哪些旧观念为eX5所打破,又有哪些新的理念被确立。正所谓不破不立,相信这些新旧观点的碰撞对于大家做服务器选型会有一些帮助。
旧观点:服务器性能高低,主要看CPU。
新思维:服务器性能高低,内存最关键,其次是I/O,然后才是CPU。
曾几何时,CPU是决定计算机性能高低的最关键因素,甚至有很多人根据CPU主频的大小来判断一台计算机的档次。不过,在今天,这一观点已经不合时宜了,即便是英特尔、AMD这些芯片厂商也承认,对于大多数应用而言,CPU已经不是服务器系统的瓶颈所在。
IBM则在分析了不同应用的性能对CPU、内存、I/O三大组件的依赖程度后发现,其实内存最为关键,其次是I/O,然后才是CPU。究其原因,一方面是因为CPU技术本身发展较快,内核数、缓存和线程数不断增加,造成了内存失衡的现象,有测试表明,一般每个CPU内核需要配备2-4GB内存才能保证平衡,不然会影响到数据存取的速度;另一方面,跟应用负载的变化也有关系,比如普及的64位应用和操作系统需要更多的内存来运行,虚拟化应用对内存的要求随着虚拟机开通数目的增加也是水涨船高。徐行告诉记者,正是针对这些应用特点,IBM的eX5架构在内存和I/O支持上做了大量文章,比如通过其MAX5技术可以在不增加处理器的前提下大幅增加内存容量。
旧观点:处理器中集成内存控制器是一大进步,对提高系统性能大有好处。
新思维:处理器中集成内存控制器,有利也有弊。
了解服务器CPU发展历史的朋友都知道,无论是AMD,还是英特尔,都已经在其服务器处理器中集成了内存控制器,取消北桥芯片,并用HT或QPI等超高速传输总线取代了使用多年的共享前端总线架构。由于内存控制器离CPU更近,使得内存带宽大大提升,数据存取速度更快,I/O瓶颈问题被大大改善。
不过,凡事有利必有弊,整合内存控制器也同样是把双刃剑。其弊端在于虽然性能大幅提升,但是内存扩展变得不太方便了,在扩内存时往往需要增加处理器,或者使用更昂贵的大容量内存条,这样用户的成本也提高了。另外,某颗CPU在访问其他CPU的内存时,由于离得远,存在一定的延时,使访问性能显著降低。
徐行谈到,作为eX5架构五大创新之一,MAX5性能优化中心可以让用户不增加处理器也可以大幅扩展内存——在机架产品中可以扩展32个内存插槽,在刀片产品中也可以扩展24个内存插槽,这样做的好处的可以支持更多的虚拟机,支持更高的数据库性能,使用性价比更好的内存条,“MAX5将扩展性提高了整整6倍,最大支持内存容量可以高达2TB”。
旧观点:磁盘阵列较便宜,也方便扩展,是服务器后端存储的好帮手。
新思维:磁盘阵列并不理想,用SSD替代普通磁盘阵列可能更划算。
前面也谈到,I/O是决定服务器性能高低的次关键因素,对此,eX5架构针对磁盘I/O和网络I/O分别加以考虑。我们知道,在一个向上扩展的多核系统中,数据存取的层次是CPU、缓存、内存、磁盘、网络,越往外层,I/O越慢。传统的做法是,以量取胜,通过不断增加硬盘的数量来提高性能。
这种传统的存储方案势必会带来庞大的负担,不仅硬件采购支出大,而且配置、设置、调试和维护也是不小的开支,随着数据量的继续增长,这种做法很难一直维持。徐行算了这样一笔帐,假设某企业有30个业务部门,需要30个平均规模为100GB的数据库,每个数据库平均要每秒执行1.5万次I/O运算,计算下来,如何要满足30个数据库加起来每秒执行45万次I/O运算的要求,再加上3年硬件、管理、电力和维护成本,总支出要达到230万元。
徐行告诉记者,对此,IBM在eX5架构中引入了eXFlash技术,用固态磁盘SSD取代传统的硬盘,为保证性能和可靠性,IBM设计了控制器。每个eXFlash模块可内置8块高性能的SSD盘,据IBM测算,其性能相当于800块传统硬盘,与800块硬盘的存储系统相比,成本节省97%,而功耗仅相当于1%。
旧观点:千兆以太网不够用,万兆以太网又太贵,没有折中办法。
新思维:万兆以太网也可以虚拟化,拆开来用,灵活又实惠。
在网络I/O方面,eX5也注意到了当前用户面临的窘境:1Gb的千兆以太网越来越不够用,而10Gb的万兆以太网又太贵,为每台服务器配万兆以太网未免过于奢侈。对此,徐行谈到,IBM的eX5引入了“中间方案”:通过其虚拟化I/O(Virtual Fabric)技术,可以将每个10Gb端口虚拟出4个虚拟端口,对应不同的应用,且同时支持Ethernet和iSCSI或Ethernet和FC。比如一台服务器上的两块万兆网卡共可以虚拟出8个端口,其中HR系统分2.5Gb,财务分5Gb,供应链系统分2.5 Gb,另外10Gb给数据库。除了更灵活,这样做的好处还能减少线缆、适配器、交换机等设备。
旧观点:双路就是双路,四路就是四路,界限很分明。
新思维:两个双路拼起来就是四路,拆开又是双路,可以更加灵活。
传统上,双路服务器和四路服务器是分开设计的,井水不犯河水,各有各的目标市场。有意思的是,IBM的eX5完全打破了这一规则,使用其FlexNode灵动分区技术,可以将两个双路系统System x3690 X5通过QPI线缆连接起来形成一台四路系统,或者将两个四路系统System x3850 X5同样通过QPI线缆连接起来变成八路服务器,因此更加灵活。
两个合在一起的HX5刀片服务器
徐行告诉IT168,借助FlexNode灵动分区和MAX性能优化中心两种技术,针对普通应用、内存饥渴型应用、计算密集型应用和复杂大型应用,HX5、x3690 X5和x3850 X5三类机器可以扩展成12种配置,大大提升了X86服务器的纵向扩展性,如下图所示:
另外还值得一提的是,配合FlexNode,eX5架构中还引入了Node FailOver技术,即当两台合并起来的x3690 X5中有一台出现故障,另一台可以实现自动切换,仍然做为双路系统继续使用,而不会向传统服务器那种全部宕掉,因此进一步提升了系统的可用性。
此外,eX5还具备很多其他高可用技术,包括ChipKill的内存校验功能(可应对数据位错误)、Memory ProteXion内存保护能力(可应对单颗内存芯片失效)、内存镜像功能(可应对单块内存插失效)和内存擦洗功能(定期的内存可靠性检测),另外还有预测性的故障警报功能,可覆盖CPU、内存、硬盘/SSD、风扇以及电源、QPI电缆等关键部件。
旧观点:廉价的低端服务器最适合云计算环境。
新思维:大型服务器其实更适合云环境,但关键看投入产出比。
使用廉价、低端的X86服务器来建设后台的数据中心,于是人们普遍认为,构建云计算环境并不需要太高端的服务器。不过,在IBM、浪潮等专业服务器厂商看来,这一观点并不恰当。浪潮集团高级副总裁王恩东日前曾就明确指出,云计算使用由低端服务器堆砌出来的“服务器农场”,其实是一种无奈之举,牺牲了一些可用性和效率,随着未来云计算进入关键领域,就必须依靠高可靠、高效率的“大服务器”,大型服务器将成为云计算硬件基础的核心。
对这一看法,徐行也认为“有一定的道理,关键是看成本与产出的权衡。”他谈到,现在很多企业在使用瘦节点组成的服务器集群,确实有利于并行计算,但并不是所有应用都可以并行,比如核心数据库就需要更大型的服务器,同时大型服务器也更利于虚拟化,而虚拟化正是云计算的基础关键技术。
在笔者看来,结合上面的分析可见,eX5架构在某种程度上大大提高了X86服务器向上扩展的能力,也是在往“大服务器”方向发展,这对云计算应用平台选择来说,或许不失为一种新的考虑。