服务器 频道

微软System Center 2012访谈速记

  提问:各位网友大家好,欢迎各位来到我们本期的视频访谈现场,今天坐在我身边的嘉宾是来自微软公司的微软亚太研发集团实验室经理刘擎先生,你可以跟我们的网友打一个招呼。

  回答:各位网友大家好,我是刘擎,现在在微软亚太集团服务区与开发工具事业部上海工作,我主要负责微软亚太研发集团在北京、上海两地的内部数据中心,我的团队同时运维着两千多台服务器在上海。

  提问:其实我们今天讨论的话题,应该说不是一个特别新的话题,应该说是和虚拟化和私有云相关,其实根据一些国外调研机构调研得到的数据,到2020年整个私有云的市场会达到150亿美元,那么这个对于任何的厂商来说是一个非常巨大的一个蛋糕。同时虚拟化作为私有云其中的一项核心技术,其实今天已经可以看到在越来越多的企业,IT基础设施中间是得到了应用,那么我们今天想讨论的问题是,其实我们今天看到了很多用户都在应用虚拟化。那么从虚拟化到私有云这个过程中间,用户还需要去,这两者之间会有什么样的一个区别,用户还需要做哪些工作才能够部署一个真正的私有云架构呢?

  回答:谢谢主持人这个问题。其实虚拟化和私有云技术,首先从微软角度来说,不是一个等同技术,因为虚拟化是一个产品的一个变革,就是经过了两千年,大家觉得会我们可以把大致上的一些技术,比如说一台机器可以当做多台机器的技术使用起来,现在在PC机,甚至一台笔记本上,微软都可以让一台笔记本当三四台操作系统,可以上面跑Linux\Mac OS,可以上面跑Windows,那么私有云技术其实微软在System Center 2012这个产品中会加入更多的元素在里面,其实微软所推出的私有云,会有包括四个重要的因素。第一,是说我们所有私有云技术围绕着应用来展开的。

  那么围绕应用就是说第二个我们会说,我们的私有云是可以帮助企业管理人员在异构系统,实现异构系统的管理,那么因为我们会看到所有的企业里面它实际上不只是只有X86架构的服务器,它可能还有交换机,或者是网络设备,各种各样的设备,我们怎么样用一个软件可以帮助他管理这一个平台。

  第三点是说我们的私有云平台必须是超越虚拟化的,虚拟化只是说我们把机器作为池化的第一步。那么虚拟化之后怎么管理,怎么去监控这个系统运行的状态和系统状态上的应用程序。然后用户的访问量,这些都要通过一个有效反映的一个平台来监控,来实现这个技术。最后一点,私有云技术可以帮助企业能更好的节省他的企业运营成本。

  提问:其实您刚才谈到了四点,包括虚拟机,虚拟化环境管理的问题,包括围绕应用展开的这些应用具体环境的这些问题。希望您详细介绍一下,就是微软具体有什么样的解决方案,能够帮助用户来解决这些问题?

  回答:谢谢主持人,那么System Center产品在2012发布,2012我们上个月,4月12号我们在拉斯维加斯做了全球的发布会,那么这个产品里面有6个主要的产品,其中包括大家非常了解的SCVMM、SCVMM用来做虚拟机的管理,那么还有SCOM,负责运维的监控、服务器和虚拟机的状态的管理,那么还有包括像SCCM,配置管理,主要是管理像所有的Windows,现在我们还可以管Mac OS和Linux,那么对它上面的补丁管理,病毒的管理,病毒库的更新,还会包括我们的数据备份管理,叫DPM。

  那么这四个产品在上一代的里面也都有,在System Center 2012,我们增加了两个新的功能,因为我们会发现,企业里面有了这些软件以后,它还得有相应非常好的业务流程,那么正确的软件加上一个好的流程,那么才能够把IT真正的成本和IT运维更加高效。另外两个产品,就是像微软我们现在做了Service Manager和SCO(System Center Orchestrator),那么Service Manager是微软其中包含了微软在去年最近的十年当中,我们自己运维数据中心,运维微软全球,像Azure这些数据中心我们得到了很多管理的经验,我们会全部通过Service Manager来放到企业中,也就是说你可以通过安装Service Manager在企业内部制定出一套完整的符合ITIL流程,符合微软的Framework这样的一个IT系统,或者说我们和很多业界看到的这种指标,也可以把你的IT系统流程自动化一下。

  提问:像您提到的在Service Manager,是不是也需要配备一个资深团队来帮助企业完成这些流程?

  回答:对,好的一个Service Manager是需要一个资深的团队去帮助你部署的,那么微软产品设计人员我们提供了一个最基本的包,这个软件包里面可以帮助你做基本的像危机管理,补丁管理,还有像事件管理和支持管理,那么已经包含在包里面,它提供了一些基础模板,那么根据企业的大小和人员对自己的业务要求,你可以自己在上面去修改这些包,或者说你可以去比较专业的资深团队帮助你设计这样的流程包和管理包。

  提问:你刚刚提到SCO的软件包,能详细介绍一下吗?

  回答:Orchestrator,我们会看到说在大的数据中心,或者是在一些企业当中,它会有非常多不同厂商的设备一同来工作,包括微软自己的那些软件,我们刚才讲到微软有数据备份。我们会发现企业的要求会越来越高,我们不再需要一个单独功能的软件,而是说我需要把所有的产品都联动起来,举个例子,首先我们需要有备份管理,但是我们希望的备份策略是每周做一次,同时我们也希望说有一个资源策略的管理,我们希望在用户访问量高的情况下,更多采用性能优先的方式去使用我的资源,那么在晚上或者是在网页用户访问请求少的情况下,我们更可能会希望是采用资源优先的形式。

  那么这种策略的变更,就要通过SCOM把数据收集到,收集到以后,我们会去产生一个触发器,这个触发器之后我们需要最终做一些具体变更的一些动作,举个例子,我们刚才的案例当中,如果说我们要把服务器增加,把一些虚拟机增加后,第一我们要生成很多的虚机,第二虚机生成完成以后,我要把每一个虚拟机的地址放到一个负载均衡器当中,那么负载均衡器不是微软的,我们可能会有像F5之类的负载均衡器,我需要对负载均衡器做一个变更,让它能够承载更多的IP,这种变更的话,传统的做法,我们是有F5的管理员,有虚拟机操作。

  现在通过SCO以后,现在把这套流程就可以全部自动化掉,它的SCO的那个工作流当中,就可以自动的帮你把虚拟机建好,并且在虚拟机建好之后,等它IP全部上线之后,连到F5上自动根据你的策略,把F5的VIP映射到后面五个真实的或者是多个的IP当中,当你资源需要回收的情况下,再把虚拟机关掉,再把VIP资源给收回来。原先一些手工的工作,现在完全可以用SCO的自动化流程引擎去把它处理掉。

  提问:所以今天我们看到System Center 2012非常强大的,也是非常庞大的一个软件的集合,它远远不仅仅是虚拟机的管理,还包括企业IT基础设施物理设备的管理,甚至包括企业整个IT流程的管理,还包括这些物理设施如何相互之间协同工作的一个管理。所以真正能够帮助企业去从一个虚拟化的环境完成到私有云的这么一个转变。

  我想问的是,现在业界有很多厂商都在推广一些概念,比如说VMware,最早在推出Vsphere 4.0的时候,曾经强调他们的Vsphere也不是一个虚拟化的软件,而是云环境下的一个操作系统,我想问一下,您对这种,其实业内提出类似概念的厂商还有不少,现在包括一些国产厂商也在说,我提出的软件是云操作系统,所以想希望您这边谈一下,您对这种业界现在所热炒的这种云操作系统的概念,您怎么看待?

  回答:谢谢主持人的这个问题,首先微软在设计这个云平台的时候,实际上我们会先定几个基本的,我们是从用户的角度和我们最终的企业客户,最终用户的角度去看的,第一,是说我们在看,我们讲云服务,首先我们看云服务当中必须要具备的几种特性。

  在微软看到,第一,它必须后面是有池化的资源,它有很多资源,第二,它必须要有自服务,就像我们到银行去排队,我们可以用ATM机,自服务,我们希望IT技术能够做的非常好的,也能够提供这种自服务门户,并且你后面的服务是有可伸缩性和可靠性保证的,也就是说我不是说每个人,举个例子,我们可能为某一种应用我们做一种小小的应用程序,那么这个应用程序,可能只能服务五个人或者是十个人,但是我如果说上线,可能将来突发事件变成一个微博这样的应用,那么我这个程序怎么可扩展性,有了这些因素之后,才能成为一个真正的云的应用。

  刚才我们提到了,就是微软System Center 2012完全按照这三点去设计和去实施的,也就是说用户通过System Center可以很方便的,把你的IT系统架构改造成为池化的,带有自服务的,并且可扩展的,实际上还有最后一点,就是说将来还可以做按时收费,就是说在很多大企业中,他的IT部门实际上也会经常做成本核算,最后一块在有些企业他会考虑说,我的IT以后就变成一个资源部门,我怎么去为我服务的那些功能性团队,或者说我的业务部门提供一个计费功能,来保证他们能够真正的使用,真正的有效合理的使用资源。

  那么这是微软定义的云应用和云的操作系统和必须具有的功能。讲到云操作系统这一块,其实微软我们会主推我们的Windows Azure这样一个平台,那么它实际上是解决的问题,就是说我们降低了开发人员的难度,因为在互联网信息爆炸的时代,你要去做一个应用,能够自服务,可扩展,并且能够快速的部署到全世界各地,对于一个初创型的公司来说难度很大。因为举个例子,你说我们做一个这种,比方说网页搜索的,文字搜索,如果说你可以把一个基础的样板程序写好,但是你要让全世界的用户访问,你必须先把它放在互联网上,你为了保证全世界的用户能够很快的访问到这个应用,你必须在全世界各地把你的应用做复制。那么接下去当你数据产生爆炸式延伸的时候,你的应用是不是能够处理一份大数据。

  这些问题都是云操作系统必须要解决的问题。那么微软的Azure就可以很好的解决,第一,微软我们会在全世界各地布数据中心,现在我们就布了七个数据中心,在世界范围内能够帮你把应用很方便的,从香港、新加坡复制到美国,复制到欧洲、非洲。第二,我们提供的整个操作系统,文件系统这一级,就相当于可扩展性的文件系统,在你上面,你申请的资源里面所有的文件系统,都是它的资源,实际上所有的文件都是一样的,你就可以想象它上面的,你上面如果申请六个虚拟机,你六个虚拟机的操作系统里面的文件是一模一样的。

  你可以在任何一个英文访问这个文件。

  提问:那也感谢刘擎跟我们分享了微软对于云操作系统的一个看法。我想话题再回到System Center 2012这个问题上来,您刚才已经提到了System Center 2012增加了一些新的组件,实际上对于它的一些旧有的组件,包括它的核心组件,SCVMM这个本身是有一些更新的,所以我也想请您介绍一下,SCVMM这个组件有哪些比较重大的一些更新?

  回答:好,谢谢主持人这个问题。SCVMM原先在上一个版本我们侧重在虚拟机和实体机的资源管理上,现在整个的业界都更围绕着这个应用,有一种说法叫做应用为王。在企业当中实际上我们会发现更多的用户,一个是要速度快,另外是要关注,就是说我的应用怎么更快的上线,我的应用从开发到发布,然后怎么能够最快的把这个流程做完,怎么能够做到自动化,并且不能有人为的错误。

  在SCVMM里面我们引入了一个应用程序模板,这个技术可以帮助像基于微软平台的,像ASP.net、SQL和MVC框架的开发代码,能够非常快的从一个开发人员机器上的样本程序的模板,复制到一个生产系统当中,那么开发人员学习成本是非常低的,他还是根本以前的开发习惯设计数据库,设计数据库的表、格式、视图,设计相应的中间件等等,前端他可以通过virtual studio在做。然后他可以在发布的时候,直接把它发布成标准的包,就用以前的发布方式变成标准的发布包,然后把这些包,现在我们在SCVMM里面可以直接支持,可以导入这些Code,生成的这种软件包,导进去之后,在SCVMM里面,我们会把它变成叫应用程序的模板,应用程序的模板在SCVMM里面会部署到不同的环境当中。你可以部署到你的测试环境中,你也可以部署到你的生产环境当中。

  更不可思议的是说我们可以让你的应用直接具有可扩展性,也就是说你原先设计的时候,你用的是一个虚拟机,我们通过这样一个框架改造以后,我们可以在SCVMM里面应用程序,你可以扩你的虚拟机,可以扩你的中间件。那么如果结合System Center 2012功能的话,你甚至可以扩你的文件系统层次。那么整个这样的话,你就可以通过我们怎么把互联网的快速部署,然后分布式的文件系统全部在私有云里面帮助我们实现了。

  提问:其实我们也发现在互联网个人的一些应用程序,更新是非常快的。但是企业级的程序往往更新就没有那么快。实际上SCVMM应该是打造了一个内部的PaaS的平台,然后大大的简化了这种程序开发的流程和这种有效的程序。

  回答:对,我这边想补充一点,就是关于刚才我们讲到的,就是说这个发布这一块,实际上在企业当中,我们应用程序的变更也是非常重要的和后续人员的支援,因为当一个程序上线之后,它的测试和它的使用会有挺多不可预知的问题,那么在System Center 2012的产品,我们增加了对应用程序的监控,这个监控不只是说我能够监控到这个程序是正常的运行,还是关闭,还是它报错,我们甚至可以把程式的调用应用全部展示出来,和调用代码所有里面所有每个参数的细节,就是在出错的时候他的调用应用是什么样的,这样的话就可以把一个应用程式出错所有的状态汇集起来,回溯给开发人员,这就避免了一种传统的那种问题支持的难度,通常是说我们会看到很多情况会发生,一个用户在使用一个系统的时候,打一个电话到客服中心的时候,我这边出了一个问题,IT的服务人员就会说,您出了什么样的问题?然后说我这个页面打不开了,然后IT人员会问他,你认为打不开是什么样的现象?然后用户说,就是打开浏览器输入这个网址,报了一个什么错。

  这还是比较好的用户,很多用户说就是打不开就是打不开吗?那么这种问题通过System Center 2012以后,它就把所有客户端打不开,如果是和服务器有交互的话,它把客户端的代码全部抓到了,那么在服务器上就可以知道这个用户访问过的应用,返回了一个文件的错误,然后IT管理人员就可以把信息汇总到开发人员,说OK,你看到有多少用户访问碰到这种错误,然后它的报错是什么样的,参数是什么样的,请分析一下,OK,开发人员就比较清楚,知道下一步应该怎么去分析了。

  提问:您刚才介绍了很多SCVMM对于开发平台的改进,除了这方面的改进建,还有一些别的改进吗?

  回答:SCVMM我们刚才讲的是应用程式,还有虚拟化管理,那么在这一版本中,我们会注意到很多客户会管理多种虚拟化平台,我们在SCVMM这个版本我们增加了对异构的虚拟机的管理,例如Xen 4.0的支持,也对ESX 6.0支持。同时我们也增加了对硬件厂商的F5等这种负载均衡器的支持。那么同时我们在Web层次的应用,那么对于存储厂商我们会和很多的像EMC、HDS提供这种通过它的标准的业界的SMI-S的管理接口,我们可以通过System Center直接去管理存储里面的LUN,也就是说一个只要经过可能半天左右培训的工程师,就可以直接通过SCVMM去管理存储上的这些LUN划分,把这些LUN划分到某些实体机或者是虚拟机上。

  提问:实际上您说的最后一点,对于这个存储资源的管理,这个我觉得应该是意义非常大的。因为我之前也跟很多用户也聊过,一个存储系统从分配,从它连接到它分配这种LUN,这个操作是非常复杂的,所以我相信英文2012对企业的运维人员能够起到很多的简化管理的这种作用。

  回答:对,我们希望通过System Center把所有这些资源能够全部汇总其他,因为有了汇总以后,对于管理人员来说,他的平台就比较统一,而且它一个视图上就会把所有的资源全部看到,否则的话在管理上,我之前也碰到过一些挑战,就是说在实验室里面自己去管理的时候,如果没有统一平台的话,我必须要像数据库分区的操作一样,就是说我脑子里永远是两张表,一张表是说我知道资源组A是什么样的,资源组B是什么样的,我在调配的时候我永远要想这两边是不是可以交换。如果通过有一个统一的平台,就可以把不同的存储系统、网络资源全部统一在一个管理系统里面,我就可以很清楚的去在里面做资源的迁移。

  其实这个在我们上海实验室是应用的非常多,尤其是像我们在实验当中,各个项目组之间调配资源这个事情是非常频繁的,以前来说,在没有虚拟化统一平台,实际上是根本不可想象的,因为对于某一个项目组他不知道别的项目组有多少核心资源,那么现在我们基本上调度平台上去以后,基本上我们每周都会发生各种各样调度的事件请求,大家都觉得这个平台可以帮助大家可以用到更多的资源。

  提问:所以刘擎刚刚实际上是从微软自己数据中心运营的角度介绍了System Center 2012的一些有益的地方,所以我也想借助这个话题再问一下,像System Center 2012在微软的向海数据中心究竟是一个什么样的运营情况,您能大体的介绍一下吗?

  回答:好的,我们现在在上海的,我们有1600多台物理的服务器和台式机,我们现在在从07年开始,我们把所有的服务器采购做了标准化。就是说我们对服务器的一些基本要求,07年的时候可能是16G左右,16G、32G的机器,到08年标准就是48G、72G,去年就是96G、128G的机器,我们把服务器的CPU内存做了一个标准化之后,然后我们通过SCVMM去管理所有的机器,包括安装,包括调度,都比较容易。

  现在我们基本上的规模是450多台物理机,那么在一个SCVMM平台上进行管理,同时它上面会跑着6000多台虚拟机,就是每天工程师是在这个平台上创建、删除,然后测试各种各样的软件产品。

  提问:而且我相信您本人在运维整个微软数据中心的时候也可以通过System Center2012比较强大的报表功能,能够很清楚的了解它这个应用负载的发生的这种趋势,做出一些调配。

  回答:对,我们可以通过SCVMM直接就拿到,基本上我们可以看到我们整个这400多台物理机现在的一个内存使用状态。我昨天晚上看的话,基本上在CPU资源的话,我们富余是最多,因为CPU我们有虚拟化,基本上可以做1:8的虚拟化。所以我们CPU使用基本上在80%是可用的,内存是一个最容易碰到的瓶颈,也就是说内存我们现在大概还有20%是可以的,总共大概是12T的内存,对于400多台机器来说。

  那么接下去存储我们会更多的用本地硬盘,去放所有的数据,因为在开发测试云当中,所有的虚拟机并不要求有高可用性的要求,所以我们全部用本地的硬盘来做,存储资源基本上现在还有50%左右的空闲,大概是27个PB。

  提问:而且关键您可以在不同的工作负载需求之间能够灵活的调用,灵活的分配。

  回答:是的。

  提问:我想问一下,刚才我们也谈到了System Center2012比较强大管理的功能,我想问一下,就是从System Center2008升级到2012,用户会遇到一些障碍吗?

  回答:应该是一个有挑战,会有挑战,但是会是一个很平滑的过渡。因为在数据库迁移,因为本身System Center产品实际上都是基于数据库的应用,那么从整个的安装过程来说,我们是能够保证用户可以很平滑的从08迁到2012上,那么因为我们刚才也提到了,像SCVMM有一些新的功能的沿用,实际上用户在架构这个系统的时候,他实际上要做比较多的前期准备工作,这样的话可以保证你在迁移过去之后,能够立竿见影的产生一些效果。

  因为我这边的一个自己的经验,就是说微软的,我们通过部署这样的一些高级的System Center的组件,在系统中心当中你只有用了你才能够体会它的好处,就像你装了Word,你要是从来不用Word编辑一些东西,你永远不知道这个东西的好处。

  提问:那么我也想问一下,像System Center2012本身也提供了Service Manager这种适用于ITIL流程服务标准的这种工具。想问一下在咱们微软数据中心也在运行ITIL这种流程吗?

  回答:微软实际上ITIL整个的组织框架里面,微软也是一个主要的参与者。那么微软在内部,实际上我们会把ITIL相当于我们内部升级版,我们叫Framework,我们在数据中心运营的时候,包括我们采购,包括我们的服务器的上架安装,服务器的变更管理,服务器的出错的诊断,我们都会用Service Manager去跟踪这些里面的一些服务请求。然后在之后,实际上我们团队做了一个比较,也算是我们的一个创新吧,就是说我们根据我们的服务请求,我们把每个月的一些常规的问题,会尽可能的自动化流程,用SCO来处理掉,这样的话我们就可以永远是说处在一个非常高效的。

  提问:一个主动的位置。

  回答:对。这样的话我们可以避免重复工作。

  提问:关于ITIL我还想跟您请教一个问题,因为我也有跟一些用户聊过,有一些用户他,这个仅代表这些用户的个人观点,他会认为ITIL会有一些鸡肋的感觉,他认为ITIL更加强调的是降低风险,而并非提高效率,我不知道您会怎么样看待这个问题?

  回答:我觉得其实每个人对一个系统的理解,其实都有自己的想法,那么我也提一些我对ITIL的一些理解,就是说首先我先看我自己,我们整个的运维环境需要什么,然后ITIL里面哪些是好的,我们就吸收过来用。那么ITIL里面就是说对我们来说帮助不是很大的,那么我们暂时可能先把它放在第二期的目标里面。因为我们每一次,我们假定我们每一次同时只能做三件事情的话,我们总得选对我们帮助最大的事情的一步一步开始去做。那么对于我们来说,我们的主要目标第一个是高效,然后保证我们产品能够按时发布出去。并且每天的测试能够完成。

  因为在测试里面,我们有非常多的要求,关于测试的用力,包括它的负载测试,单元测试,这些都涉及到对于我们资源的使用,也就是说我们实际上更多的是把ITIL这种流程用在了解决我们自己每天的日常运维当中的一些问题。我们从这个角度使用,我们说实话没有生搬硬套,就是说ITIL里面的业务,我们是把ITIL拆开来做的。

  提问:ITIL所提供是一个标准化服务的模板,然后具体的企业可能在具体应用的时候都需要根据自己的实际情况,然后做一些调整。最后我还想问您一个问题,因为今天有很多企业,刚才我已经谈到了,已经实施了虚拟化,而且他们更希望去尝试私有云,那么从您的角度对这些企业去部署这种虚拟化,或者是私有云,您会给他提什么样的建议呢?

  回答:谢谢主持人这个问题。其实刚才我们已经谈到了一点,就是说我部署私有云这个产品的时候,我的基本思想是什么,其实对于微软和我自己在数据中心实施的一个经验来说,第一,一定要围绕着用户的需求,然后我们设计的系统要让用户有自服务,要让用户能够体会到说他对资源是可控制的。因为在私有云的时候,其实很多IT人员和最终用户会感觉到就是说他离资源就越来越远,原先他可能自己安装服务器,服务器装好了以后完全是自己在用的,另外,第二我们怎么要保证这个资源是可以分享的。

  那么再往虚拟化做完了以后,要往虚拟化迁移的过程当中,实际上就是再把资源分享,用户体验提高,然后所有资源的可伸缩性,并且用户可以根据自己的使用量知道自己的成本在什么地方,我觉得只要把这四点,就是说真正的你的系统里面能够展现出来,并且确实是执行的,那么我觉得这是一个很好的案例,和你自己的一个,可以给自己定一个业绩目标,这是四个角度。

  提问:感谢今天刘擎在我们演播室现场跟大家分享了很多关于私有云、关于私有化管理方面的一些经验和建议。我们也通过今天的访谈,我们也对System Center 2012有了一个更深的了解,System Center 2012的确是一个非常包罗万象的,强大的这么一个私有云平台的一个管理的工具。

  那也感谢各位网友收看我们今天的节目,我们下期再见。

0
相关文章