【IT168 方案】ROCKs+ 6.0.1基于开源项目ROCKS而且被StackIQ所支持。该解决方案堆栈在Dell最新的硬件平台上进行了测试与验证。Dell最新的硬件平台采用的处理器是Intel Sandy Bridge以及AMD Interlagos。该解决方案堆栈设计用来自动化,部署并管理高性能计算集群。此外,该解决方案集成了Dell建议的环境,参数以及脚本,而且在安装过程中能够自动配置。
具有ROCKS+的第12代HPC解决方案的最大亮点是支持如下组件:
支持Intel Sandy Bridge-EP服务器:R620, R720, M620 and C6220。
Red Hat Enterprise Linux 6.2 (kernel -2.6.32-220.el6.x86_64)。
用于R720以及C6220/C6145服务器的GPGPU的nVidia CUDA 4.1。
Mellanox OFED 1.5.3-3并支持第三代PCI-E FDR技术。
新增加的脚本与工具以配置专门用于Dell硬件的最优BIOS设置以及iDRAC/BMC设置。
引入了基于GUI的实现用以管理,监控并运行web控制台命令。
作为一个HPC软件解决方案堆栈,Rocks+ 6.0.1具有众多特性:
能够快速配置,部署,监控并管理物理或虚拟基础设施。
预先封装,自动配置的软件堆栈“Rolls”用来简化物理服务器或虚拟服务器大量基础设施的部署。Rolls软件堆栈包括了数据中心版本和云计算环境版本。
syscfg命令用于在所有节点上强制执行HPCC推荐的BIOS设置以及控制台重定向。
HPC roll具有MPI类库,因此天生就支持OpenMPI和mpich2。
此外,StackIQ引入了一个新的和功能强大的基于web的接口:
允许管理员监控节点的状态,收集CPU和网络状态。
帮助查看所有节点的网络接口状态。
查看并改变所有节点的属性设置比如主机名。
如果安装了Ganglia roll,管理员就能够使用基于web的接口监控集群的CPU,IO和网络统计数据。
ROCKS+ 6.0.1使用Avalanche安装程序部署节点。当使用Avalanche安装程序进行系统部署时,在GUI中显示可视化部署。GUI显示每个节点的推送包,这样能够消除前端安装程序或者头结点的I/O瓶颈。
▲配置了Ganglia Roll 的ROCKS+ 6.0.1监控
▲
HPC集群是一个具有多个组件的分层架构。庞大的代码是包含了各种软件组件的一个捆绑解决方案,这些软件组件用于对集群进行部署与配置。该软件包包括了如下组件,但是每个配置可以添加或删除其他的组件。
- Base Roll 和Core roll -开源组件ROCKs的主要组成部分
- Kernel Roll- 提供操作系统级的支持
- Web Roll–使用Apache Web服务器为基于GUI的web控制台提供支持
- HPC roll–MPI 中间件类库与工具
- Ganglia Roll–用于监控健康状态的开源集群监控工具
- Sun Grid Engine–开源工作任务调度器
- OFED Roll-选择Mellanox OFED还是Qlogic OFED取决于集群的硬件配置
- NVidia CUDA roll–GPGPU驱动器和编译器的官方支持
- Dell Roll-包括了Dell配置最优BIOS,BMC. iDRAC的脚本与工具而且提供了Dell当前硬件以及新硬件的最新驱动以及固件版本。
访问高性能计算社区。