【IT168专稿】随着集群技术的进一步普及,以及更多厂商的参与,集群的应用范围被进一步拓宽,更多的用户开始接受和认可这种价格低廉、管理和使用相对简单、技术门槛相对较低的高性能计算平台。这两年来,几个主要集群生产厂商的增长率都在50%左右。但同时我们也看到,在经历了几年的沉寂之后,刀片服务器重新被市场所认可,成为业界关注的热点之一。近期,刀片服务器市场的出货量一直持续增长,许多重大项目在关键应用和核心业务都采购了刀片服务器。
随着刀片的崛起,人们开始担心,在刀片的强力竞争下,集群将走向衰落,刀片将占据集群原先占据的市场。是什么原因让人们产生这样的顾虑?又是什么原因让刀片和集群产生了如此激烈的竞争?
刀片和集群都在高速发展
众所周知,刀片服务器是指在集成了网络等I/O接口和供电、散热、管理等功能的机柜内,插入多个卡式(刀片状)服务器单元。这些卡式服务器单元就是通常所说的刀片。刀片本身具有处理器、内存、硬盘、主板等部件,与塔式和机架式服务器的区别在于I/O接口、供电、散热和管理等功能全部由机柜统一提供。每个刀片可以独立安装自己的操作系统,因此可以把一个刀片看成一个简化的机架式服务器。但是刀片本身并不能单独运行,它依赖于机柜的公用部件,例如电源、散热等。
![]() |
| 曙光第二代刀片服务器TC1600 |
而集群(Cluster)是指对外部网络表现为单一系统的服务器群组,它由许多独立的服务器按照某种结构,通过各种网络(计算网络、管理网络、存储网络等)连接在一起,配合相关软件,作为一个整体向用户提供计算资源。按照功能模块来分,集群大致可以分为节点子系统、网络子系统、存储子系统、管理控制子系统、电源子系统、散热子系统和集群软件等几大部分。节点子系统中的每个独立的服务器通常都拥有自己的处理器、内存、硬盘、主板、I/O、电源、散热和操作系统。
![]() |
| 曙光4000系列集群服务器 |
从根本上看,刀片服务器是塔式服务器和机架服务器之后的又一种服务器类型,是服务器技术的最新发展。特别是在人们逐渐认识到每瓦特计算能力&每立方米计算能力的重要性时,刀片服务器提供了一种切实可行的改进方法,它在增加计算密度的同时,大大简化了系统管理和部署难度,减少了线缆和系统功耗,符合人们当前对资源(空间、电力、人力)节省的诉求。有专家预测,未来两到三年,刀片服务器将以更高密度、敏捷式部署和维护、全方位监控管理、高可扩展性、高可用性为发展重点,成为与机架式服务器并驾齐驱的成熟的主流产品,并被认为是除多核心外,服务器发展的另一主要方向。
而工业标准化的集群系统因为具有高可用性、高可伸缩性、高性价比和易管理性等特点,已经成为当前高性能计算机的主流架构。如2005年11月发布的全球TOP500超级计算机中,集群系统占据了72%的份额。而且通过几年的市场积累和技术发展,包括不断降低的技术门槛和各集群厂商以高性能计算普及为目标的推广活动,也让众多用户接受了集群。越来越多的用户认可,再加上成熟的技术,集群系统迎来了普及应用的时期,市场容量会进一步急速扩张。
刀片与集群在融合
通过上面的阐述,我们了解到,刀片服务器是极具发展潜力的一种服务器类型,而集群是构建高性能计算机的主流的体系架构。从概念上说,两者分别属于服务器类型和计算机体系架构,不属于同一范畴。从产品角度而言,刀片服务器是单纯的服务器产品,而集群则是包含硬件和软件的综合系统,按理说不应该放在一起比较,但两者却存在着显而易见的市场竞争。审视刀片服务器与集群系统,可以发现两者之间存在着众多的相似点――非常相似的硬件结构和极其相近的设计思想――刀片服务器就像一个缩小后的集群系统。
其实早在2000年RLX公司率先推出单CPU刀片服务器时,其最初的想法就是研发一种高性价比、高可用、高密度的服务器,而这正是集群的特点所在。刀片服务器的推出引起了业界的极大关注,这其中最被看重的就是计算密度的跳跃式增长。在RLX之后,IBM、HP等厂商也根据各自的集群硬件架构,设计出了各自的第一代刀片服务器。这一代刀片产品通常都参照集群硬件设计思想,将交换网络、存储网络、管理系统、KVM、电源控制系统等全部整合到刀片机柜内部。直到现在的第二代刀片服务器仍然遵循着这一硬件结构,只是在网络带宽和接口类型、速度以及更加丰富的管理功能上得到了进一步发展。
第一代刀片产品密度非常高,有些甚至能在3U机箱里装入9个刀片。正是这种对于超高计算密度的疯狂追求,客观上造成了第一代刀片服务器的种种缺陷,因而推出不久就遇到了寒流,客户对于散热、功能简单、性能瓶颈等问题抱怨连连,出货量大幅度降低,刀片服务器进入了市场冷冻期。
而此时集群早已开始了它的高速发展:网络延迟等技术难题被相继克服,更多的应用程序被开发,关键技术不断普及,单个机架式服务器的计算能力不断增加等等。经过几年来的积累和推广,集群已成为市场上高性能计算机的主流产品和主流体系架构。
其实,集群系统在硬件和软件上所取得一系列成就也促进了处于低谷的刀片的成长。比如最先在集群系统上实现的大规模KVM Over IP技术,以及为解决集群系统网络延迟的Infiniband高速网络,都已经应用到第二代刀片服务器的设计中。
随着集群系统的高速发展,几十万亿甚至上百万亿次的超大规模集群系统都已经被制造出来。但是,超大规模代表的不仅仅是超级快的速度,还有超级大的空间,超级大的电力消耗,超级强的散热装置,超级多的线缆,超级复杂的网络连接。怎样克服这些问题呢?融合了集群系统最新技术的第二代刀片服务器以其节省空间、降低功耗、减少线缆的特点再一次走入了人们的视野。此时的刀片已经解决了上一代产品的各种缺陷,最显著的改变就是适当降低了计算密度,在此基础上提高了计算性能,注重了扩展性,增加了许多新功能和新接口。再次走向前台的刀片服务器将与集群系统进行怎样的竞争呢?
刀片是集群的杀手?
我们经常能听到“刀片是集群的杀手”之类的说法,但这种描述并不准确。存在竞争的不是刀片服务器和集群系统,而是刀片服务器集群和机架式服务器集群,刀片服务器真正冲击的是机架式服务器的市场。因此,刀片服务器集群就是由刀片服务器、集群软件、集群高速交换网络、存储网络等组成的集群系统,在体系架构上与机架式服务器集群没有任何的区别,它们的市场定位与目标客户也基本相同,可以说,哪里可以用机架式服务器集群,哪里就可以用刀片服务器集群。刀片服务器集群和机架服务器集群各自的优点如下表所示:
|
