二、TCO概念被用烂了吗?
TCO这个词已经被用烂了。很多并不懂IT的管理人员和财务人员都是以降低TCO为由来缩减IT投资,但实际上,许多典型的服务器硬件特性都是在降低TCO的基础上开发出来的。如果我们不懂TCO,就不可能做出适当的购买决策。
跟仅关注硬件成本的TCA(Total Cost of Acquisition,总获取成本)不同,TCO是指采购和使用服务器过程中产生的总成本,包括服务器整个生命周期过程中产生的采购成本、安装配置成本、技术支持成本和优化应用成本。因此,我们在评估服务器时至少需要考虑以下几个方面:
- 总采购成本
- 在网络中安装服务器的时间成本
- 软件配置和远程管理的时间成本
- 在数据中心机房中占用的空间成本
- 消耗的电力成本
- 发现和解决故障、重新配置、采取安全措施以及维修服务器的成本
- 用户等候系统重启的相关成本
- 电力中断或系统宕机导致用户无法访问服务器产生的相关成本
- 升级服务器以适应新需求的时间成本和金钱成本
- 安全方面的成本等等
但TCO的概念也会带来负面影响。比如,有些管理人员会认为硬件成本在TCO中只占有极小的一部分,从而忽视了硬件的比较选购。另外,有些服务器厂商也用TCO来标价,以掩盖其硬件或服务上的高价格,而TCO本身是个预测值,并没有过硬的数据做支撑。
而实际上,TCA即硬件采购成本仍然在TCO中占大头。有研究表明,服务器的采购成本仍然占TCO的40-50%,维修成本占10%,运营成本占40-50%。其次,选择不同的硬件对TCO的最终构成会有着重要的影响。比如,如果采用冗余和热插拔的磁盘阵列,一般就会大大地减少服务器的宕机时间,从而节省运营成本。
另外,服务器的RAS特性(可靠性reliability 、可用性availability、可服务性Serviceability)也跟TCO息息相关,并影响了服务器产品的设计。IBM曾经做过一项研究,发现50%的硬件故障都跟磁盘有关,其次是电源故障(25%),风扇故障排第三,仅占8%。因此,为了获得更高的稳定性,以减少TCO,就需要高可靠的电源和磁盘系统。同样,服务器需要高可用性设计,经常损坏的部件要实行冗余,如对于运行关键性业务的服务器来说,RAID、冗余电源、冗余风扇都是非常必要的。另外,采用热插拔设计可以帮助用户在保持系统运行的状态下更换或维修损坏了的部件,从而提高可服务性。
可见,服务器其实是围绕“降低TCO、增强RAS”这一核心理念来发展的。下面,我们就从TCO的角度来分析一下塔式、机架和刀片这几种服务器形态之间的竞争以及它们各自的发展变化趋势。