【IT168 专稿】在信息膨胀的时代,数据的飞速增长让企业不堪重负。Gartner研究表明,对于大型企业来说,数据增长是数据中心硬件基础架构所面临的最大挑战。据预测,全球数据量在未来五年将增长650%,交易型数据越来越多,业务的增长与合并使数据处理负载量激增,巨大的压力对即时计算速度以及数据访问的可靠性提出了更高的要求,尤其在数据驱动的关键性业务中,这一点表现得更为突出。
关键性业务的高效运行离不开企业的命脉——数据库,传统的大型企业数据库平台有些还在采用RISC小型机方案,但是这种方案的投资成本居高不下,且运行维护难度大。如何随数据增长弹性扩展数据容量,并在成本与性能之间取得平衡,成为摆在企业面前的一个难题。我们下面将以IBM最新的基于英特尔至强E7处理器的eX5服务器,以及DB2 pureScale为例,来阐述如何通过x86服务器集群来帮助企业应对上述挑战。
▲基于英特尔至强E7处理器的IBM System x3690 X5服务器
x86数据库集群解决之道
我们知道,对于在线交易处理(OLTP)业务来说,系统平台的性能高不高只是一个指标,关键的是,每天、每分钟都要保证提供持续的高性能,而不管上面的应用工作负载如何变化。而且,OLTP服务器还需要灵活可扩展,根据组织业务的发展而改变。
传统上,对于象OLTP这种企业级数据库应用来说,大型SMP服务器是个不错的选择,但其成本相对高昂,而且其扩展性也局限于Sclae-up(向上扩展)一个维度。集群式(Scale-out)的x86数据库扩展方案提供了另一种选择,这种技术实际上也已经使用了多年。不过,集群的应用仍然是个技术活,需要管理人员耗费许多时间和精力来做数据重分区、工作负载平衡、性能优化等工作。
为此,IBM和英特尔两家公司也一直在合作,试图通过新的技术来改变x86计算的经济性。其中一个合作成果就是面向集群、分布式系统的OLTP平台,实现了无可比拟的灵活性和可扩展性。在这个平台中,基于英特尔至强E7处理器的IBM System x eX5服务器,如x3850 x5、x3690 x5等,提供了关键业务环境下数据密集型应用负载的基础。而IBM的DB2 pureScale功能,则能够把这些服务器以集群方式连接在一起,凭借高性能、线性扩展和高可用性等特色,共同以更加经济的方式来支持大规模的数据库应用,DB2 pureScale的总体架构如下图所示:
▲DB2 pureScale架构
如上图所示,DB2引擎在集群的各个服务器上运行,在每个服务器之间提供一致性的访问。DB2pureScale提供故障检测和自动恢复的集群整合服务。IBM通用并行文件系统(GPFS)群集实现共享磁盘架构。群集缓存功能(CF)提供Group Buffer Pool (GBP) 和Global Lock Manager (GLM)的运行实例。这些组件可确保群集服务器之间的直接互通,通过锁定和缓存提高数据库性能。
不间断运行的高可用性
在一个DB2 pureScale集群中,一台服务器可以通过冗余来避免单点故障,并提供集中的锁管理服务、面向数据页的全局缓存及其他服务,从而消除了在传统分布式系统中托管数据库的挑战与限制。pureScale集群的成员服务器在做读、写操作时,可以同时访问后台共享的数据库。它们也可以通过InfiniBand网络来直接访问中央服务器。通过这些技术,一个由多台x86服务器组成的DB2集群系统,对于上层的OLTP应用来说,看起来和运行起来都象一台高性能服务器一样。如果集群中的一个节点宕机,系统会自动地把负载切换到备用节点上去,从而尽可能减少意外宕机时间。因此,DB2 pureScale可在实现快速操作的同时获得更高的RAS特性:
▲成员服务器故障情况下业务保持运行