云计算：分布式网络服务可靠性分析-服务器专区

云计算：分布式网络服务可靠性分析

作者：小程编辑：洪钊峰 2008-09-17 10:39 来源：IT168�

云计算的现状

“云”计算最好的例子无疑是Google。这个网络世界的巨头搭建和控制了数以百计、千计甚至于百万计的硬件盒，构成了一朵庞大的“云”。但为了应对不断增长的网络用户的服务请求，Google还在一刻不停地扩展着“云”的规模。

当然，Google并不是唯一的实践者，而是几乎所有大型的网站包括Amazon, eBay, Yahoo! 和Facebook都采用了各种形式的云计算。尤其是Amazon，凭借着它在分布式计算领域的领先地位，在过去的15年一直完善着这项技术，所以不难理解它要将未来的赌注压在垂直网站服务上。他们相信未来属于云计算，掌握了云计算的核心就掌握了生财之道，这一点上没人比他们做的更好。

云计算的可靠性

对于Amazon的服务崩溃，也许有业内人士会想：如果换成是我做的话，我一定能做的更好。这种设想一直存在于软件业的发展史中，如计算机语言种类的重复发明、API不断地推翻重写，我们总认为比前人更聪明、更富有创新性，但99.9%的事实证明我们是错的。所以说这次错不在于Amazon，在我们之前，他们已经投入了巨大的财力和人力来试图解决这些问题。大规模的运算服务是一个异常复杂和庞大的问题，即使对最具智慧和前途的工程师来说，也需花费数年来弄懂和解决它。

就目前来说，搭建云计算平台可以通过独立设计和技术购买两种手段来实现。除非特定云计算结构需要独立设计外，大部分情况下，采用Amazon网络服务的云计算结构能满足需要。如果要击败对手，必须要明白和突出自己的产品的独特性，否则走重新设计的路线，你会发现你已失去时间和资源。

也许Amazon服务崩溃不仅仅是“云”的问题，是否还应该考虑一下SLA(Service Level Agreements，服务品质协议)？明明SLA上保证的是99.99%的网络服务可用率，可当服务使用3小时后就陷于瘫痪的情况该如何解释呢？我们应该知道，无论SLA上怎样的承诺，它不可能保证电力供应系统和“云”结构的完美无瑕地运作。

所以我们不能盲目相信SLA，而是要动用自己的大脑。评价一个系统性能的稳定性不是看它是否会崩溃，而是预测它出现崩溃现象的频率。如果Amazon的网络服务一年内只有3小时的停工期，那么可以认为是完美无缺的；如果是每个月，那么就是不可接受的；如果是每天，那将是令人抓狂的。

未来的发展

Amazon事件不会影响它的网络服务计划，更不会阻碍云计算发展的步伐。Amazon一直是云计算的先行者，它建立的大规模平行网站式计算服务正为世界上越来越多的人所接受。我们有理由相信这仅仅只是云计算的开始，它正在从根本上改变着人类运算的方式。

云计算解决了扩展性的问题，供应商们就能把精力集中到自己产品和服务中去。随着硬件成本、带宽和服务费用不断降低，云计算不再缥缈，而是触手可得，人类将乘着云计算来到了另一个天空。

第1页：“云”与LAMP 第2页：云计算的可靠性

关注我们