服务器 频道

采用ROCKS+的戴尔第12代HPC解决方案

 

采用ROCKS+的第12代HPC解决方案
进入高性能计算社区

  【IT168 方案】ROCKs+ 6.0.1基于开源项目ROCKS而且被StackIQ所支持。该解决方案堆栈在Dell最新的硬件平台上进行了测试与验证。Dell最新的硬件平台采用的处理器是Intel Sandy Bridge以及AMD Interlagos。该解决方案堆栈设计用来自动化,部署并管理高性能计算集群。此外,该解决方案集成了Dell建议的环境,参数以及脚本,而且在安装过程中能够自动配置。

  具有ROCKS+的第12代HPC解决方案的最大亮点是支持如下组件:

  支持Intel Sandy Bridge-EP服务器:R620, R720, M620 and C6220。

  Red Hat Enterprise Linux 6.2 (kernel -2.6.32-220.el6.x86_64)。

  用于R720以及C6220/C6145服务器的GPGPU的nVidia CUDA 4.1。

  Mellanox OFED 1.5.3-3并支持第三代PCI-E FDR技术。

  新增加的脚本与工具以配置专门用于Dell硬件的最优BIOS设置以及iDRAC/BMC设置。

  引入了基于GUI的实现用以管理,监控并运行web控制台命令。

  作为一个HPC软件解决方案堆栈,Rocks+ 6.0.1具有众多特性:

  能够快速配置,部署,监控并管理物理或虚拟基础设施。

  预先封装,自动配置的软件堆栈“Rolls”用来简化物理服务器或虚拟服务器大量基础设施的部署。Rolls软件堆栈包括了数据中心版本和云计算环境版本。

  syscfg命令用于在所有节点上强制执行HPCC推荐的BIOS设置以及控制台重定向。

  HPC roll具有MPI类库,因此天生就支持OpenMPI和mpich2。

  此外,StackIQ引入了一个新的和功能强大的基于web的接口:

  允许管理员监控节点的状态,收集CPU和网络状态。

  帮助查看所有节点的网络接口状态。

  查看并改变所有节点的属性设置比如主机名。

  如果安装了Ganglia roll,管理员就能够使用基于web的接口监控集群的CPU,IO和网络统计数据。

  ROCKS+ 6.0.1使用Avalanche安装程序部署节点。当使用Avalanche安装程序进行系统部署时,在GUI中显示可视化部署。GUI显示每个节点的推送包,这样能够消除前端安装程序或者头结点的I/O瓶颈。

采用ROCKS+的第12代HPC解决方案
▲配置了Ganglia Roll 的ROCKS+ 6.0.1监控

采用ROCKS+的第12代HPC解决方案

  HPC集群是一个具有多个组件的分层架构。庞大的代码是包含了各种软件组件的一个捆绑解决方案,这些软件组件用于对集群进行部署与配置。该软件包包括了如下组件,但是每个配置可以添加或删除其他的组件。

  • Base Roll 和Core roll -开源组件ROCKs的主要组成部分
  • Kernel Roll- 提供操作系统级的支持
  • Web Roll–使用Apache Web服务器为基于GUI的web控制台提供支持
  • HPC roll–MPI 中间件类库与工具
  • Ganglia Roll–用于监控健康状态的开源集群监控工具
  • Sun Grid Engine–开源工作任务调度器
  • OFED Roll-选择Mellanox OFED还是Qlogic OFED取决于集群的硬件配置
  • NVidia CUDA roll–GPGPU驱动器和编译器的官方支持
  • Dell Roll-包括了Dell配置最优BIOS,BMC. iDRAC的脚本与工具而且提供了Dell当前硬件以及新硬件的最新驱动以及固件版本。

  访问高性能计算社区

  原文链接:http://en.community.dell.com/techcenter/high-performance-computing/b/general_hpc/archive/2012/03/06/12g-hpc-solution-with-rocks_2b00_-from-stackiq.aspx

0
相关文章