服务器 频道

四川电信X86架构服务器迁移实例介绍

  【IT168 资讯】梁天健:尊敬的各位来宾,上午好!非常荣幸有这样一个机会,把四川电信在IT系统架构优化方面的一些尝试、一些思考和大家做分享。

  我主要讲三个方面的内容。首先回顾我们的历程,以及我们在这个过程中遇到的一些问题。四川电信业务涵盖的内容还是比较全的,从移动业务到固网宽带业务包括行业应用等等。目前大概有2700万-2800万的用户。随着用户规模的扩大,我们企业内部运营支撑系统不断地膨胀。现在IT设备数量已经从原来的几十台、一百台增长到上千台,数据量不断地膨胀,原来是G的容量,现在到PB级的。整个系统内容不断丰富和完善,我们覆盖了所有的范围,IT子系统的数量超过了100套。

  从这十几年的发展历程来看,我们最初系统是比较小型的内部支撑系统,到开始引用大型数据库。再到从本地分散的系统到全省集中的系统。再到近几年的云计算、虚拟化、大数据时代的来临,我们也是经历了很多阶段。这个过程中我们遇到了非常多的困难和挑战。一方面是性能上的瓶颈,随着业务量的增长、数据量的增长,性能上的瓶颈导致我们在硬件方面只能不断地采购更高配置的硬件满足我们对容量的需求。另一方面数据增长过快问题比较突出,IT的从无到有的整个过程还是比较缺乏全生命周期的数据管理,所以面临数据增长的问题上我们遇到了很多挑战。所有的硬件上的问题、性能上的问题、数据上的问题,导致我们IT运营的能力遭受极大的挑战。特别是在IT基础架构方面,我们以前是高度依赖于高性能小型机系统,对于原厂的依赖性非常高。应用架构方面,传统的应用架构设计方式不能有效满足我们高速的业务数据量的增长。

  面对这些挑战,这几年我们做了一些探索,做了基于现状的创新。这方面的探索有几个先决条件,一个是互联网技术的发展,确实给我们带来了很大启发。运营商角度来讲,在IT这方面向互联网企业来学习,另一方面是云计算技术的逐步成熟也是我们觉得可以的,让我们可以有所突破的基础,在云计算资源池,统一的监控管理平台和大数据的应用平台这几方面,我们做了一些阐释希望可以逐步走向应用的集群化,我们硬化更专业,管理更集约化。

  四川电信这几年,2008年开始构建IT系统的资源池,一是基于x86服务器做一个基础,同时充分利用了虚拟化平台的高可用性的技术提高整体系统的稳定性,在应用上,我们把我们的核心成长系统逐步整合到环境中来部署。基于物理设备,通过虚拟化的软件或虚拟化的设备,最后组装类似于一个个的基础单元,除了基本的计算能力、存储能力以外,还统一部署了标准的数据库、中间件、工具软件等等的能力。基于这个基础单元之上,我们完成了大概有100个系统,超过一千套虚拟机的IT基础设施的资源池,这个资源池在我们中国电信各个省公司里面也是最大的云资源池。

  现在所有的IT生产系统,80%左右的应用全部已经迁移到这个资源池上。包括面向客户服务的CRM系统、计费的一部分应用也在上面。整体来看,效果非常不错。整体的TCO下降60%。资源池的部署上线时间大幅度缩短,以前做一个硬件部署,包括从采购到最后部署上线,时间是以月来计,大概半年左右的时间,现在几天时间就可以完成部署上线,所以这方面的提升非常大。维护管理方面也有非常大幅度的提升,以前我们的维护,那么多的小型机,维护人员非常紧张。现在整个量增长了之后,现在只有一个人员为主来维护整个云资源池。总体能耗下降也是非常显著,接近50%左右的能耗下降。所以通过云资源池的建立,的确提高了我们整体运行效率,包括系统可用性、可维护性。

  另一方面我们在积极探索分布式计算的应用。这方面主要还是面临现在大数据量的数据挖掘、分析的应用。很多的挖掘模型的数据量都超过了十亿级,在原有的架构上已经无法实时处理庞大的数据。我们引入了分布式计算系统架构在比较低廉的硬件设备之上,这方面效率提升非常显著。这里举个例子,数据挖掘的效率从原来80多个小时降到现在几小时之内完成,提升非常明显。

  虽然我们已经做了这么多的尝试和实际应用,我们还希望进一步在应用方面提升集群化部署、分布式处理的能力。大数据平台方面我们希望明年要构建大数据基础平台,在这之上有一些比较适合的应用在上面,包括日志、内容、流量的分析。在云计算的平台上,除了继续做迁移,扩大它的应用范围外,特别是在云管理方面要进一步加强。

  具体的几个想法。一是把x86的应用服务器,在IT系统的应用范围进一步扩大。除了计费域和数据挖掘领域还有一些传统的小型机的应用,这些部分我们打算在近一两年内全部迁移。

  在云计算应用上,我们电信运营商除了内部IT支撑系统外,还有很多的业务平台,我们也希望在这个领域除了内部的IT系统外,能扩展到所有业务平台,实现内部基础设施、云计算的全覆盖。也希望能尝试着推出一些对外的资源出租、资源服务的产品。在云计算的统一管理方面,虽然资源池建立起来了,实际上现在的运营管理相对比较薄弱,我们也希望和合作伙伴一起加强我们的自动监控、统一配置、统一调度、自动流程控制的能力,这是迫切的,随着规模越来越大,运营管控问题成为了非常重要的问题。

  大数据的挖掘分析。我们希望把若干系统大量的系统日志信息通过大数据平台进行挖掘和整合。原来很多日志信息沉淀下来没有发挥它应有的作用。现在我们的系统非常复杂,很多业务承载、服务提供都要跨若干子系统完成,这对我们的运营来说挑战非常大,所以我们也想利用大数据,包括Hadoop技术,把我们的系统日志进行监控和分析,提升自动运营能力。

  我们和英特尔公司以前是间接的合作,见面比较少,但是一直在使用英特尔的产品。现在我们开始更多面对面的直接合作,我们希望以后在几个方面进一步加强合作,包括应用系统的性能优化、云计算平台、大数据平台。我们双方合作共赢。

  以上是我们的一些经验和思考,再次感谢英特尔公司提供这样的机会,真诚地希望我们和所有的合作伙伴能够在这方面在未来有更深入的交流和合作。谢谢大家!

0
相关文章