服务器 频道

中国移动X86架构服务器迁移实例

        【IT168 资讯】各位嘉宾上午好!我是中国移动研究院业务支撑研究所的段翔,非常感谢英特尔提供这样一个平台和机会,有机会在这里和大家面对面的交流中国移动在Unix应用迁移方面的一些实践。

  我主要从几个方面来展开:Unix应用迁移概述,迁移案例实践、相关技术。

  刚才中国电信的同仁向大家展示了电信在这方面的考虑和总体规划,我在这里主要是把中国移动在Unix应用、迁移的具体实践和遇到的问题以及对于这个技术的期望和大家分享。

  现在x86的服务器开始替代小型机进入关键业务,主要的驱动力是我们现在觉得PC服务器和小型机相比从性价比方面逐渐具有很大的优势。TPCC有一些指标可以说明x86服务器和小型机相比在平均性价比方面有很大的优势。现在x86服务器进入关键业务,其实软件技术设计起到了比较大的作用。原来的软件设计,更早的IT系统建设强调单机可靠性和单机性能。现在随着云计算技术和IT技术的发展、IT架构的发展,很多软件层面的可靠性、可扩展性设计,降低了对底层服务器单机可靠性和单机性能的要求。原来一个小型机,Unix单机小型机性能高可靠性,能达到整个系统的可用性和性能,通过x86服务器虽然每一台单机的性能和可靠性和Unix小型机相比目前来说还有一定的差距,但是通过软件应用,在集群应用、可靠性的设计能够提升整个系统的性能。面对小型机逐渐出现的系统封闭、维保成本高的问题,x86技术已经一些关键系统的业务选择。

  中国移动的Unix小型机迁移也考虑了一段时间了,在今年我们在一些省公司开展了Unix小型机迁移的试点,主要是小型机退服、Unix扩容,还有一些系统方面开展了试点。英特尔公司对于我们整个项目,还有部分省公司的实施也提出了很好的建议,我们也开展了一些合作。

  对于一些系统的迁移我们进行了实践,然后把整个迁移步骤分成方案制定、开发、部署和上线。其中最关键是方案制定。在方案制定中,有一些关键技术,包括x86应用的选择,可靠性方案设计、数据迁移方案、操作系统的选择、x86服务器的选择、迁移风险管理。在这个过程中,在案例实践中我们也对这样一些问题总结出一些方法。接下来我们对中国移动的Unix应用迁移方向,通过这样一些实践会有更多的推进。

  接下来就一个很小的案例,我们进行详细的分析。在某省公司我们进行了SSO(单点登录系统)Unix应用迁移的尝试。我们发现目前这套系统是用基于IBM的小型机实现的,目前存在系统利用率低、维护成本高、系统升级困难、处理能力不均衡的问题。在这个迁移案例中,我们针对省公司的SSO系统实施迁移,时间进程是从2012年4月-6月制定方案,今年6-7月集成商进行开发,7月份开发完成,8月部署、上线,经过几个月的实践发现迁移效果比较好,间接印证了很多系统里面Unix应用完全可以被x86服务器应用代替。

  在整个方案制定过程中我们首先梳理了业务应用的基本信息和特点,模型和资源的使用情况。这里不详细讲具体方案。重点和大家分享在这个案例中看到的一些问题和技术方面的思考。在方案制定的时候,我们发现原有的方案是用了四台IBM的P550的服务器和两台IBM的P520的服务器,架构比较复杂,扩展性和应用灵活性都存在一些问题。我们对这些信息进行了汇总,采用原来的架构,从软件层面的可靠性、横向扩展能力都不足,所以我们对整个应用进行了重新设计和开发,对性能、可靠性、可扩展性都提出了新要求。

  迁移后的方案采用了比较灵活的外部应用、数据三层的架构,解决了原有的系统复杂性、系统扩展性的问题。(图)新架构如图所示。接着我们进行了成本分析,根据迁移前的服务器的成本,大概是台小型机128万,迁移后我们用了4台x86的服务器,加上一个立旧的小型机,价格是48万。我们在应用实施过程中发现,众所周知通过一些平时评测和技术厂商的交流,我们知道英特尔的CPU性能是高的,但是价格也是高的,所以很多时候,在系统应用中,特别是我讲这个案例是比较小的应用,在这些小的应用中,很多时候计算能力是过剩的,对于一个应用来说,很有可能它的瓶颈或者技术架构设计的能力不在于追求技术能力的性价比或者高性能,很多时候计算能力在整个系统里都是远远过剩,不管用哪个CPU,它的利用率都比较低。再加上中国移动服务器的采购体制,这时候会有一些低价格的因素产生比较主导的作用,在这个项目的服务器选择和分配里,很可能选择价格比较低、性能要求又不高的型号。这是一个现象,当然这和各个公司,还有和英特尔,还有和你们竞争对手的市场定位都有关系。

  制定完方案后,集成商根据方案进行开发,然后我们进行了系统部署、联调和压力测试,证明这个系统是可用的。在进行测试完以后,我们把系统部署上线,上线以后新的应用提供服务,x86应用适应性的时候,Unix应用保持在线一段时间,通过x86应用出现问题的情况下可以进行接管。监控运行的状态在一段时间稳定之后,Unix应用下限,小型机就用在其他地方。我们也可以看到,两台业务主机的CPU占用率比较低,在这个小系统里对计算能力要求并不是特别强。效果是这样,迁移前采用IBM统一认证的软件部署于六个小型服务器中,存在系统利用率低、处理能力不均衡、维护成本高、系统升级困难等四大问题,迁移后采用J2EE的软件架构,应用部署在四台x86服务器,数据库部署在一个小型机上,通过迁移服务器成本从128万降低到48万,降低62%,同时实现了系统可拓展性、可靠性,将来可以纳入云计算的资源池。

  这里只是一个非常小的案例,从这个案例来看总的服务器采购成本,降低的效果是非常显著的。某省公司也做了测算和评估,一个省公司通过前期的评估,他们的支撑系统和业务系统中的Unix小型机,就目前情况就有240台Unix小型机的业务可以迁移到x86服务器,经过测算每年电费可以节省270万,机架费用可以节省420万,人工成本每年可以省150万。光从现在的情况来看,一个省公司每年在进行Unix迁移以后,节约的成本会超过两千万,这是不考虑技术发展和业务扩展的情况下就能达到这样好的效果。通过测算我们对Unix应用向x86迁移有更多的信心和更多的驱动力。

  在应用迁移过程中我们也发现了一些问题,也希望在这里和英特尔和英特尔众多的OEM合作伙伴进行分享。我们对CPU及整机实现更好的性能、功耗的调控能力,我们发现了一些问题,有一些希望。相比存储网络等系统,CPU发展速度非常快,每瓦特的性能不断地提升,对于目前大企业和互联网应用来说,尤其是目前应用是多种多样的,比较小的零散的应用,CPU的能力往往是过剩的,这会造成功耗的浪费。目前英特尔推出了Node Manager技术可以实现节能及POWER Capping,但目前支持的厂家有限,调控的范围还有一定的局限性,所以我们也是在研究的过程中,希望英特尔低功耗的CPU在一方面Micro Server发展的成熟的情况下,另一方面希望CPU在不同利用率的情况下,能够更为智能,发挥更大的性能、功耗和调控能力,特别是在利用率比较低的情况下的节能和休眠,这个功能对我们公司是很重要的。再就是希望我们和英特尔和OEM厂家一起推动CPU、整机节能技术的广泛采用和管理的标准化。

  英特尔现在CPU的型号比较多,性能比较强。但是使用过程中我们发现有一个问题,它的性能分布不是很均匀,一方面CPU的型号特别多,另一方面性能分布不是很均匀。E5的24系列和26系列,很多型号,它的性能看起来是比较重叠的,很多时候集中在高端,低端方面的CPU的型号性能分布很不均匀,这样给我们的一些应用的CPU型号选择造成一些困惑,很多时候不知道到底哪个,相信英特尔推出这么多的型号,性能的分布是有自己的市场和战略考虑的,但是从客户来说,我们觉得在选择的时候有一些困惑,希望英特尔能够在这方面给我们进行一些培训或者开展一些合作的研究。一方面英特尔这么多的CPU性,哪一种适合哪些业务,或者哪个特别针对哪类客户的哪类应用,能给我们一些建议。这么多的型号我们看的眼花缭乱,如果这个型号特别适合电信业务中的云计算业务或者适合桌面虚拟化,那么它背后在一个什么平台上,采用什么样典型配置,能够有一些非常好的实践提供给客户。这样我们在进行CPU型号选择和应用系统构建上就会有更清晰的路线和更好操作的方式,希望接下来能够和英特尔从研究院的角度有更多的探讨。

  再次感谢英特尔提供这样的机会和大家分享。谢谢大家!

0
相关文章