服务器 频道

灵活性:机群管理软件的灵魂

    【IT168 专稿】随着计算任务和数据处理的规模越来越大,很多用户开始部署各种服务器集群(机群),以取代传统的单机应用模式。但要配置和管理好机群系统,用户需要考虑多种千变万化的现实因素,比如网络配置、特殊应用、软件安装和升级维护等等。一个机群管理软件成功的关键就在于能否灵活的适应这些变化。总体来看,一个好的机群系统管理软件必须具备以下特性:

  • 完成多种不同任务的基本功能,包括并行命令的执行、配置文件管理和软件维护。
  • 硬件系统可灵活扩展,以支持不同的硬件。
  • 支持多种节点安装方法,如本地直接安装、节点“克隆”或无盘操作。
  • 支持多种网络配置,包括路由器、防火墙、低带宽网络和高安全性环境。
  • 监控能力必可配置、可扩展,并且兼容标准。
  • 管理软件须有适当的应用编程接口和命令行接口,以支持各种形式的机群网络结构。
  • 模块化和可定制,以适应现有结构和工作方式(如命令行接口、扩展性、单独使用某一部分等)。
  • 具备时常更新和用户反馈的机制。

    可见,灵活适应性是机群管理软件的灵魂所在。下面将讨论上述特性,以供用户在选购机群系统时参考。

灵活的基本功能

    机群管理的内容非常丰富,通常能提供可完成各种任务的简单工具,这些工具越灵活越好。机群管理的基本功能包括:

  • 支持多种操作系统版本:工具要求能跨多种类型的操作系统和体系结构。尽管Red Hat企业版(RHEL)和SuSE企业服务器版(SLES)是企业机群用得比较多的两个版本,但也有不少机群用户用到一些免费的版本,如Fedora、CentOS、Scientific Linux和Debian。
  • 分布命令执行:一个分布式Shell是最基本的机群组件,它允许管理员在整个机群或一部分节点上很快的执行命令行操作。这种功能是很有用的,因为它允许管理员不需要其它管理软件的支持就能完成工作。必要的灵活性包括超时设置(对那些没有响应的节点),跳过一些不在线的节点,以及使用任何底层远程Shell的能力。
  • 文件分发:分发文件是机群第二个基本的能力。文件分发有两种模式:单次复制和在整个机群中保留一个公共文件库。在整个机群或一部分节点维护配置文件时,采用后一种方式具有相当的灵活性,它允许不同的节点组使用不同版本的配置文件,且允许复制文件前后运行用户定义的脚本。
  • 软件维护:软件维护就是节点安装成功以后升级和安装软件的能力,对于管理员在不重装节点的情况下安装或升级单个应用程序是相当重要的。这个功能必须自动安装一些系统必备的RPM软件包。

    使用上述基本工具就可以完成大部分复杂的机群工作,包括高性能计算应用程序的安装和启动、机群用户管理、服务的配置和启动,以及添加节点。例如,高性能计算软件的安装和启动就可以通过软件维护和分布式shell做到。象NTP和自动装载器这些服务的配置和启动,还有用户管理,就可以在管理服务器通过分发配置文件来配置。

    目前,xCAT、Oscar中的C3工具包、Scali Mange和CSM等机群管理工具都具有上述功能。也有一些工具具备一部分部分。如Red Hat的网络升级程序(up2date)和YUM提供了软件维护的功能。

0
相关文章