服务器 频道

Power7虚拟机与x86物理机应用测试对比

  【IT168 资讯】12月15日,北京798艺术园区仁艺术中心上演IBM Power虚拟机和x86物理机的性能大战,IBM通过两个实际应用场景展示了一个迥然不同的应用服务器部署方式:Power虚拟机应用服务器。从性能、能耗、空间三个角度对IBM Power虚拟机和x86物理机进行了测试对比。


▲IBM大中华区地区合作伙伴部总经理张思民

  IBM大中华区地区合作伙伴部总经理张思民发表了演示了Power7虚拟机与x86物理机应用测试对比。以下为演讲纪录:

  其实关于Power Unix小型机和x86之间到底谁优、谁劣,谁好、谁坏由来以久。我知道几个星期以前,IBM在网上发布了这条消息,“择日Power小型机与x86在某地展开一场殊死搏斗。这个消息发出以后,我特别留意网上一个论坛,因为论坛里各个派别都有,里面有坚决支持x86的,也有靠AIX、靠Power赖以生存的工程师。我特别把两个非常典型的,代表对这场比赛网友主流的看法,给大家看一下。在右上角有位网友说,他已经开始估算这次比赛的结果,他说如果说性能,x86肯定赢,如果讲能耗空间,Power一定赢。如果讲价格,不用谈,x86一定赢。如果说性价比的话,不用谈,x86一定赢。它代表了相当大的群体对这个比赛结果的预判。再看一下支持Power这边,有趣的是,他竟然同意对方,Power是贵,但是贵有贵的道理,关键业务、稳定等等。但是你发现,不管是支持Power的还是支持x86,他们有一个共同的结论,如果你讲性价比,那一定是x86,这就是我们的主流观点,我们今天想用实际的测试,看看这个主流观点是一个事实,还是一个迷思。刚刚Max把这个选秀讲得轻松愉快,这次比赛可能会让网民稍微有些失落,因为最后你会发现,没有尸体被抬出去,不会打得你死我活,这也不是我们的目的。我们的目的是,因为我们的目标用户不是一些选秀的观众,不是来看打仗的,他们是一些企业的决策者。我们希望通过这次比赛,目的是希望让决策者有很理性的决策,只是给他一个新的视角。这个视角是什么呢?刚才韩总也在他的PPT里说,我们现在的服务器不是你手里的笔记本、台式机,而是每个人口袋里的移动终端,现在已经达到220亿的接入,在数量极端爆炸的情况下,我如何保持支持这样系统,但同时我还要节能成本。这个看似是一个矛盾的问题,怎么去解决它?今天在x86遇到的一些难题的时候,我们是不是换一个视角能把这个问题解决,这才是这个大赛的目的。

  在大赛之前我们首先把网上炒得很热的Power小型机和x86PK赛,这个命题我们清晰一想,如果命题不清晰,或者伪命题的话,你得出的结论也帮不了企业做决策。这个命题是什么呢?这个比赛不是简单的两块铁之间撞,从企业角度来讲,待会儿还有专门的政府客户跟大家分享,他们怎么看计算机等等,你会发现他们首先着重的事情是,不管是什么系统,还是要跑我的应用。这个命题跑不开的是,应用的性能如何,以及要支持这个应用所带来的成本越低越好。我们平时买车看车评的时候,没有人简单的说这个车子轮子最便宜、底盘最便宜,最终我们要把所有零件整合在一起,整个车的性能和价格进行比较,所以命题我们首先要搞清楚。

  首先看一下网上热议的最便宜的x86到底是怎么回事。有一个非常大的误区,这个误区是说,只要单机成本是最低的,加起来的系统成本也一定是最低,这个在逻辑上是谬误的,逻辑上本身是错的。在x86成长过程中,比如是个企业用户,很多年前我们上一个网络服务器,或者再加一个OA服务器,再加一个小小的财务软件,加ERP、CRM、SEM等等,每次加一个就加一台服务器,用户从50人变成200人,我们再加3台服务器,一个分公司变成3个分公司,再加3台服务器,每台服务器都很便宜,2万多块钱,但是加起来一定便宜吗?待会儿我们有一个实际的产品,这就是IT行业应用的老大哥们今天遇到的困境,大家知道老大哥是两大行业,一个是金融,一个是电信,这都是比很多行业早启动IT应用的,他们就是这样一点点、一点点加成这样。我们公司在鸟巢旁边有一个大黑楼,我一开始不知道那个大黑楼是什么,因为没有窗子,我说我们办公室都有窗子,对方的办公室怎么不要窗子。后来有些零售商告诉我们,这是当年奥运会的时候给起的奥运的数据中心。从固定终端到移动终端,任何人任何时间要上网的时候就变成这个样子,很便宜的单机,加起来是很忙的系统。这些原因我刚才赘述过了,分开上,边干边上,走到哪上到哪,多了用户,再加3台,于是乎从3台变成了30台,由30台变成了300态,这是成本加法的IT部署方式,加机器、加电力,电力除了供电以外,还有空调,还有加机房空间,要造一个能承载这样环境的机房,耗资是千万的,有时你想出钱都不能建机房。原因是,我们国家电网说电路拉不过去,你造了也没电。这样加起来还有维护人员,一个小的单机就变成一个非常昂贵的系统,就是这样由来的。我们今天讨论的是说,企业走到这个地步的时候还有出路吗。我们今天专门找来一个新兴IT行业政府的决策者,他们还会走这样的老路吗。

  看看x86的机房就想起我们今天的停车场,这个停车场指的是我们的环线。以前买一辆车在四环上奔驰感觉很爽,现在机场高速都快成停车场了,每一辆车似乎很便宜,但是加起来很贵。你仔细看看车窗里面,车起码是四座位或者七座位的,有几辆四座位的车能坐满,大部分时间坐1-2个人,但是占停车面积一样,油耗一样,这就是今天我们面临的问题,怎么解决。

  我们今天就是测试,真的不是要拼个你死我活,然后把一台机器抬出去扔了。今天是个严肃的话题,是跟企业的决策者说,有没有另外一种可能性。我们特别找了两个行业的典型案子,一个是成熟行业,遇到困境以后怎么解决。二是由于两三年前国家医改投入大量资金到医疗行业,卫生厅从原来比较少上IT,到现在开始大量启动IT的新兴IT行业,从这两个行业的视角看看今天的变化。

  首先,由我先和大家介绍一下成熟IT行业,就是电信的用户是怎么考虑这个问题的。今天我们专门拿了一个电信增值业务,大家都非常熟悉的应用,叫手机报,我自己每天都会有我们的运营商给我推送一份图文并茂的手机报,碎片时间看的手机报。手机报这样一个家喻户晓的应用,在运营商里实际代表着什么。我们今天做测试,这边有两个42位高的机位,右边放了两个x86物理机,我们把这两个机柜上下切成一半,上半部用来做我这个测试场景的,下面一半是我的同事介绍政府行业的测试。我们现在有两家派报纸的公司,组织报童去发报纸,这个报童是怎么样呢?在这边有4核8G的x86服务器作为发报纸的服务器,我们叫发送终端。这边有一台Power710,说韩总说他要大肆赠送200台给软件开发商和合作伙伴的机器,高度都是一样的,4台来发报纸,这边一台来发报纸。这儿多一台是为了我们要模拟电信这边的网关,这个网关直接接到交换机上。这边Power也有一个模拟网关。因为我们今天给的值跟企业决策者有两方面的考虑,一是一次性的采购成本的性能价格比。在运维以后的运维成本也需要考虑,大家可能想象不到,运维成本里的电费是像烧钱一样,为了做这个实测,我们给每台机器后面加载了实时能耗测试仪,我们给710加载了能耗测试仪,让工程师先清零,我们开始跑的时候,就是报童开始发报纸的时候,我们看它用多少电能。再看汉铭信通用的x86,我们也把这个仪器清零。清零以后,因为它大概需要10分钟的时间,你开始跑的时候,10分钟以后能耗进入稳定值,那时候我们再采集一下,看看x86服务器在送报纸的时候和710服务器在送报纸的时候要多少电能。710用量太大了,一台用不完,我们切成虚拟机,切成4-5个虚拟机,用一个个虚拟机为单位和物理机器做连接。

  里面的系统环境怎么样,刚才Max很强调,不管这是一个测试还是选秀,中间是不能有内幕,不能有潜规则。这个系统环境大家可以看到,710是8核32G的配置,用的虚拟化软件叫PowerVM,操作系统是AIX6.1,还用了IBM的JVM虚拟机。在x86里每台是4核8G的,虚拟化没有,操作系统是Redhat Linux企业版,JVM:SUN JDK1.6。虚拟机软件本身是会吃系统资源的,如果真的要公平的话,Power也不用虚拟机,物理机的性能,理论上讲一定要比虚拟机好,我们之前也曾经想过,在x86中加载大家比较熟悉的,比如VMware,但是加载以后虚拟机的性能大幅下降,到30%以上,导致网上说太不公平了,我们说不如这样,我们用虚拟机,这边用物理机,让它不戴手套,我们戴着棉花手套。如果从系统结构图,这台710分成3台2C和一个1.5C作为手机报的发送端,再加0.5C作为虚拟I/O服务器。这4台,非常直截了当的一台一台物理机,4核8G作为发送端,发送到模拟电信机房网络终端,再接交换机。我们把710作为所有发送端公用服务器。

  我们最终要给企业决策者两个非常明确的值,一是第一次采购成本的性能价格比如何;二是采购完以后开始运营,运维成本这两个环境如何比较。基于这个前提下,我们设计了以下几个测试场景:1.性能测试:用了两个彩信包,一个是50KB,一个是300KB,我们看看Power虚拟机和x86物理机谁发的条数多。为什么用50K和300K呢?这是和实际应用有关,50K的彩信是什么概念呢?就是你现在收到的图文并茂的手机报彩信,很快运营商会给我们发300K的彩信,那里面不仅仅图文并茂,还有视频。如果我把这台机器全部用满,把这些物理机全部用满,规定大家在同时要发20万份报纸,20万条彩信发下去的时候看谁用的时间短。2.系统弹性测试。大家看到之前几页,电信机房里上千台机器在转,好像很认真的在工作,你再问一下当地系统的管理员,这里怎么在跑,实际上他们大部分机器是30%以下的利用率,甚至很多服务器在空转,没有人访问,在空转,还在耗电,为什么这样呢?是因为这个系统没有弹性,一个有弹性的系统是说,当应用上来的时候,它给你配备2核资源或者8核资源,当应用负载下去的时候,它会把资源动态调走给其它应用,这里面讲的就是所谓虚拟机的颗粒度,虚拟机颗粒度越小,说明系统越有弹性,这个是直接影响到系统本身的维护成本。这点我们也和大家做了测试。能耗测试,待会儿可以看到能耗。空间对比,是一台机器用多少空间。

  我们现在进入第一个测试环节,这个测试环节是用了这台机器2核4G虚拟机,加上这一台整机,它们发送两个彩信包,一个是50K的彩信包,一个是300K的彩信包,我们看看这两个报童的效能如何,我们先看看50K的彩信包。在大家的右手边有两个窗口,上面的窗口实时记录了Power2C4G发送短信条数。下面是x86物理机实时发送4C8G发送短信的条数,为了确保大家看得清楚,这边我们用柱状图给大家列出来,如果大家能看到那边的彩信条数,看到Power虚拟机每秒大约在2200条彩信数字在发送。这边的物理机,大约在每秒钟500条短信的发送。在柱状图里可以看到,下面这个报童很勤奋,每秒钟2000条。上面的这个报童稍微胖了一点,走路慢了一点,每秒钟500条。我们多加报童,看看上面这个报童要多少个才能达到下面这个敏捷的报童呢?工程师现在把另外三台x86服务器也作为发送机器发送进来,把它启动,基本上现在它的情况稳定下来了,这台里面的2核4G虚拟机基本上在2100、2200条的信息发送量发,这四台全部跑起来,每台也接近2000台,基本上比较对,一个虚拟机和4个物理机的性能基本是一样的。这是50K的信息。如果下一个阶段运营商说要发带有视频的手机报,又是怎么样的呢?下一个环节测试一下300K彩信,这两个报童发放的情况。做法还是一样,上面代表的是Power7102核4G的虚拟机,发的是300K的彩信,下面是1台x86机器,它每秒钟能发送多少条300K的带视频的彩信。

  我们先看一下50K彩信的情况,绿色柱状是代表2C4G的Power虚拟机每秒发送2200个,基本上稳定在这个数。黑色部分是一台x86物理机,每秒钟所发送的条数,平均在500条。基本上是4.4倍,一个Power虚机和一个x86的整机,性能差4.4倍。300K也是一样,一个虚机对一个物理机,上面的虚机现在的性能在380条左右,下面的物理机大概在98-100条左右,也还是有大概4倍的差别。这次又把这四台机器开足了,看看它的性能怎么样,还是1:4的关系。从性能角度来讲,我们通过两个实际场景,50K彩信和300K彩信实际场景,我们得到一个蛮准的实测结论,这个结论是说,1台Power的虚拟机,这个虚拟可以指2C4G虚拟机的配置,它的性能等于4台x86的配置,每台x86是4C8G。

  我们可以用另外一个方式同样比试这两个环境,这次不是说我们自己的环境看谁跑得快,而是固定,说这个老板要求今天要发放20万份手机报,看两组报童谁在最短时间内把手机报发完,发完之后就干其它事,在这个场景里测试。同样的环境下,一台整机用足了,看一看和这四台也用足了,把整个环境全调动起来发20万个报,看谁发的最快。我们工程师做了一个更有趣的画面,右边非常枯燥的这些信息变成了一个运动场,上面这一栏是Power710,把它的核用来派送报纸,下面是4台机器,开足马力发报纸,上面已经有10万条报纸出去了,下面很努力,4台机器现在解决了5万份,33秒钟上面的Power710跑完了。这四个非常努力的孩子们继续发,在这个时候,上面Power710系统,如果你的系统够弹性,上面系统的计算资源已经可以调给其它资源来用,不用停在哪里。x86总算发完了,用了98秒,大概是1:3的时间。这里面我们可以看到,我们最后要测算出性能除以价格比才有比较数字。

  我刚才提到弹性,这个孩子有一个什么问题,作业做得太快,一下就做完了。如果你不让他干别的事,他就待在那里,但是这个孩子一直在干那一件事情。你钱也花了,不管是一次性采购成本,电费、空间费都在那里,怎么办呢?这时候我们提出第二个很重要的概念,就是系统的弹性。这个机器,你想象这是一个大房子,这个大房子能用多少个方式隔成不同的办公室,有的是一个人的办公室,有的是20个人的会议室,有的是10个人工作组的办公室,而且能够千变万化,随时可以变,越是能千变万化的,说明越有弹性。如果能开出的虚拟机越小越好,在刚才讲电信机房场景的时候,客户告诉我们,他们里面有很多应用,比如游戏软件,这个游戏软件可以很成功,也可以很失败,这个游戏软件成功上线以后,可能过了3个月,访问人数才有几百个人,那时候对计算机要求的资源是很低的。但是如果我把它放在一个整体的机器里面,这台机器90%的时间在空转。第二个问题,电信运营商告诉我们,我是不是可以简单的把这个应用从我的硬盘里铲掉,因为他的投入产出比是负的,他们又不能铲掉,因为他和写这个软件开发商签了一年的协议,让价就得在上面跑,不能走。那时候怎么办?我最希望的是说,我给他一点点,有人真的喜欢他的时候,我再把资源调给他。能做到这一点吗?这就是对系统弹性和颗粒度最直接的要求。

  我们切回到测试,我在网上看到的评论也很有意思,Power虚拟机对x86物理机,也说明这个人还是蛮懂的,这个人要懂得PowerVM这个东西,这个东西是很深奥的,一般人不懂,我也很害怕,我问工程师,PowerVM多难,工程师说这就是PowerVM。第一,0.5核放给了虚拟I/O,后面2.0、2.0、1.5,是每台虚机分的CPU的核数,右边是使用状况,我们这边一直在用虚拟机,已经跑满了。现在看一下这个系统的弹性,让工程师演示一下,如果这个场景里不需要或者没有2000个报纸要发,如果是一半的时候,这个资源是不是可以调下来,进行实测一下。实际上PowerVM是可以自动做的,我们手动给大家看一下。我们把核数从2调到1,再看下面的报纸派发量,从2200条降到1300条,你反过来理解也一样,这个应用负载只需要1300的时候,它的计算资源给它分1核就好了,另外1核可以做其它的应用。如果继续往下降,应用负载又下降了,有可能不是高峰期,是低谷期的时候,这个核数继续少下去,比如到0.5,现在只分配了0.5核给到发送机,从刚才1300条降到现在的500、600条。我们在看虚拟机好坏的时候,有两个关键值,一是虚拟机分区的时候,是不是有蚕食,虚拟机的颗粒度,PowerVM虚拟机颗粒度最小能够达到0.1,一个CPU核0.1都可以启动起来,刚才那个应用场景里面是说,这个应用不好卖,我又跟人签了一年的运维协议,就让他跑吧,用最低的资源给他跑。比如只有100个人访问,这个游戏做的不像愤怒的小鸟那么成功,很失败,但是签了一年的协议,就给他,这就是我们讲的系统的弹性。

  刚才的性能测试做完了,一个虚机能打赢4台物理机,在20万份派发的时候,一个是百米赛跑,一个是马拉松式赛跑。我们看一下这些孩子们吃饭的饭量大不大,越小越好,因为我们是很恶毒的资本家。现在我们看一下两个机器的能耗表,看看Power710现在的能耗是多少,161.5瓦,由于我们的小型机都是冗余的,这个机器是双电源冗余电源,没有什么黑幕,这个能耗161是要乘以2的。再回到x86,是单电源设计的,一个电源坏了,这个机器就不能运行的,这个单电源的机器用的是142瓦。

  最后是空间,空间是很贵的,尤其是有各种各样设备的机房。空间怎么比呢?根据刚才的测试以后基本上得出这样很准的结论,1台2核虚机的性能等于4台x86服务器的性能。如果我们把整台机器运行以后,按三倍计算,1台710跑满以后,等于12台x86服务器,如果在机房里工作,12个柜子是不能装12个服务器的,因为中间还要有空间,还要有制冷。回到刚才起始的问题,我们今天的测试不是要争论性价比谁优谁劣,而是我们要给成熟的IT用户一个思考,在今天堆满的服务器架构里,有没有可能换成这种节能减排的部署方式,用Power虚拟机的部署方式。

  最后,我把刚才所有的数据做成一张表进行总结。我们把它分成起始采购性价比和运维成本这两部分。从成本总价格以上是成本采购,有一点可以看到,710两台8核的,性能上最后等于24台4C8G的,价格加起来,单台的价格最后加上一部分授权的费用,最后加起来大约是100万人民币。与之相当的710,加上软件开发上的服务,加上所有的中间件,包括AIX、PowerVM、PowerHA、WebSphere、Application Server、软件开发商各种各样的服务,价值是相当的。所以在一次采购成本上,有一点是肯定证明了,刚才大量主流意见说x86架构性能价格比上一定比Power好,这是错误的。再看运维成本,如果710是花2个U,一共4的U,在x86上48U,到电信机房里这就不是便宜的。电费,这边总电费是10万元,那边总电费是1.8万,这是公认的Unix Power在线可用性是x86的10倍,x86经常宕机,Power几乎不宕机。这是第一个环节,在一个成熟的IT市场,我们对x86、Power实测的结论。

  了解更多详情请猛击会议专题

Power7虚拟机与x86物理机应用测试对比

0
相关文章