【IT168 评论】随着“云物移大智”(指云计算、物联网、移动互联网、大数据、智慧城市)的发展,今天企业的数据中心正变得越来越复杂,一方面是各种应用层出不穷,这些应用对后端的计算、存储、网络提出了不同的要求,有些是计算密集型,有些是数据密集型,有些是IO密集型等等,另一方面则是IT硬件技术也出现了多样化发展,如CPU核数越来越多,虚拟机和云计算使用越来越普及,万兆以太网和Infiniband各有千秋,机械硬盘和固态磁盘各有优势......这些对用户的异构资源管理、IT应用资源匹配都提出了新的挑战,需要通过管理软件来解决,“软件定义”也因此受到了大家的广泛关注。
近日,在位于北京上地的IBM中国区开发中心,IT168记者就”软件定义基础架构“这一话题,采访到了IBM系统部软件定义基础架构大中华区业务经理周立旸和IBM系统部软件研发实验室软件开发总监谢东博士。
何谓”软件定义基础架构“?
首先,我们来了解一下什么是”软件定义基础架构“。
据介绍,IBM所谓的软件定义基础架构主要涉及三个层面,分别是软件定义计算、软件定义存储和基础架构管理。具体来说,就是通过Platform Computing、Spectrum Scale、Cluster Manager、Cloud Manager、SoftLayer等一系列软件,来帮助用户实现分布式计算环境的整合,从而为不同类型水平扩展的应用提供弹性的共享资源池,实现IT应用的灵活性和资源调度管理的智能化。
其一,在软件定义计算层面,近年来,不同类型的分布式架构应用越来越多,从最早的高性能计算集群,到Hadoop大数据集群,再到内存计算、流计算、Spark、MongoDB等一些新型应用,由于采用不同的软件堆栈,需要不同的底层基础设施,进而造成集群蔓延、成本增加的现象。
IBM提出的一个可行办法是通过资源管理和应用管理软件,来在一套弹性的资源池上整合不同的应用负载。这套软件就是IBM Platform Computing系列家族产品,包括Symphony、LSF、Application Service Controller(ASC)等。其中LSF主要是针对高性能计算应用的资源调度,Symphony则主要面向高性能分析和Hadoop大数据应用,ASC针对Spark 和MongoDB等新型云应用,并通过容器的技术来保障应用的业务连续性。
其二,在软件定义存储层面,随着数据类型越来越多,冷热度不均的数据也需要存储在不同的介质上,对存储架构、存储技术、IO带宽都有各自的需求,因而也需要有智能的流程来管理存储资源和数据。
对此,IBM近期已经推出了全新的存储软件产品系列IBM Spectrum Storage(光谱存储),将之前分散的存储管理软件重新整合,涉及“监控、保护、虚拟化、加速、备份、扩展”等6大类功能。IBM承诺未来5年将投入超过10亿美元开发下一代技术,以强化其在软件定义存储领域的领导地位,这些投资将主要用于新的云存储软件、对象存储与包括OpenStack在内的开放标准技术的研发。据了解,IBM光谱存储管理软件通过存储虚拟化、GPFS、XIV等技术,能够集中管理超过300种不同存储设备,以及高达YB级别的数据规模,帮助用户以自动化方式选择合适的、更经济的存储设备。
其三,在基础架构管理层面,对用户而言,数据中心的异构化也日益突出,传统集群、私有云、公有云都可能涉及,从而形成一种混合云的IT环境。对此,IBM也推出了不同的方案来应对这些基础设施的管理,比如Cluster Manager可以实现多个物理机的管理和部署,基于OpenStack的Cloud Manager可以实现多个虚拟机的部署,同时这些技术也在IBM的云数据中心SoftLayer上面应用,提供平台即服务的软件。通过这一系列技术,IBM得以帮助用户实现异构基础架构的管理。
周立旸谈到,IBM所谓的软件定义基础架构中的”软件“一词有双重含义,其一是指IBM的全系列产品本身就是软件,二是指客户的应用软件。对用户来说,IBM的软件可以针对应用特点来实现底层基础设施的优化、自动化等功能,赋予IT基础设施自动感知和适应上层应用负载的能力。
Platform:随分布式架构起舞
早在2011年,IBM收购了Platform Computing,这家企业在当时就已经是为分布式计算环境提供集群和网格管理软件的全球领导者,尤其是在高性能计算领域有着重要的影响力。四年后,Platform Computing变身为IBM软件定义基础架构战略中的重要一环。这当中发生了哪些变化?
周立旸告诉记者,Platform最大的专长在于”工作负载感知“,在加入IBM大家庭之后,以一种中间件的形式,构成了IBM系列通用产品如服务器、存储、GPFS与各种不同应用负载之间的接口,从而可以通过资源管理、作业调度等方式来实现工作负载的优化。而这正是Platform系列产品对于IBM和用户的价值所在。
谢东也谈到,Platform在被IBM收购之后,产品定位并没有大的改变,但侧重点有一些不同,主要是与IBM原有产品结合更加紧密,比如针对GPFS文件系统、POWER平台、大数据分析软件进行了深度优化。
另外一个较大变化是Platform Computing的适用面在扩宽。周立旸告诉记者,诞生于1994年的Platform实际上已经有20多年历史。但早在2000年,Platform在国外的一大部分收入就已经不是纯高性能计算类业务,而是帮助很多金融机构、投行做高性能分析应用。相比之下,国内高性能分析运算要晚于国外,但这几年随着大数据的产生,需要复杂的、分布式架构来实现,因此国内也看到越来越多的市场机会。对Platform而言,无论是高性能计算,还是大数据或云计算应用,其本质都是分布式计算,因此,随着应用的扩展,Platform的适用范围也正变得更加宽广。
谢东补充道,在研发思路上,IBM不只是关注Platform产品本身,而是会更多关注行业应用,针对不同行业、不同用户的需求来定制方案。据他介绍,IBM在收购Platform之后,将其全球主要研发力量都集中在中国,经过几年发展,团队规模已经达到近400人,不仅有开发、测试还有售后技术支持,主要分布在北京、西安、上海。。
案例知多少
从具体实际案例,周立旸介绍了包括花旗银行、USAA保险公司、大港油田在内的多个客户案例,有的是数据密集型应用,有的是计算密集型应用。
比如,花旗银行采用了软件定义基础架构的解决方案,通过使用Symphony、GPFS、Spectrum Scale等,实现了百倍的应用性能提升,涉及全球4个数据中心、超过300个应用。
美国USAA保险公司由于业务快速发展导致基础架构成本急速增加。IBM通过使用BigInsights高级分析工具、Platform Symphony、Spectrum Scale等软件解决方案,最终将其5个业务部门30多个组的大数据和分析应用,包括CRM、欺诈检测、网页点击流分析等,整合在一个平台上,实现了多租户共享服务,即在一套集群上可以同时运行多种不同的大数据和分析应用,大幅度减少硬件投入及管理成本。
又如,红牛赛车通过Platform实现高性能计算调度、软件许可调度和流程调度等功能,以提升硬件使用率和设计流程效率。
这里值得一提的是高性能计算云的应用。过去业界有说法认为高性能计算和云计算两者之间是不可调和的,因为虚拟化环境不太适用于HPC这类应用。但实际上,云计算的构建并不一定要依赖于虚拟化来实现。周立旸告诉记者,通过Platform、SoftLayer和其他软件,也可以实现基于物理机集群环境的弹性资源池,可以动态实现软硬件部署,或者让应用在不同集群之间切换等,使得用户可以通过私有云或公有云的方式来实现高性能计算。
如中石油大港油田通过Platform Computing实现高性能计算云,在一套云环境中运行十几个不同的HPC应用,而无需构建多套集群。
又如,Transvalor和MINES ParisTech等公司面临的挑战是其数字风洞实验需要先进的HPC解决方案,而其研究人员又没有能力搭建自己的HPC环境。对此,这两家公司联合多个商家尝试建造HPC云服务,汇集先进的流体模拟软件,IBM为其提供了基于Platform Computing和SoftLayer的HPC云服务,让用户可以通过即用即付费的模式来获得低成本、高质量的HPC能力,大大降低了中小企业和大学研究人员进行HPC研究实验的门槛。