服务器 频道

HPC存储非常好的实践系列之:快速暂存方案

HPC存储模板
进入高性能计算专区

  【IT168专稿】有些应用程序需要一个既能提供高性能、高容量、高效率又能很容易部署、整合及管理的文件系统解决方案,这时候非常好的选择就是Dell&Terascala HPC 存储解决方案(DT-HSS)。

  Lustre的典型部署和配置既复杂又很耗时间。部署Lustre通过命令行界面来安装和管理,这可能阻碍不熟悉软件的系统管理员部署Lustre。另外为使Lustre安装达到最好的性能需要考虑众多的选项,该过程并不简单。Dell&Terascala HPC存储方案不仅避免了上述复杂性,而且在最大程度上减少了部署和配置时间,这样我们就可以尽快测试文件系统并为生产环境做好准备。

  DT-HSS实现了基于并行文件系统的存储应用方案的所有优势,在成本上也更加划算,虽然DT-HSS基于Lustre,但使用、安装、配置及管理与Lustre相比都更加简单。DT-HSS存储方案可以较轻松地被整合为一个集群并提供良好的单用户和全系统性能;而且与安装、管理Lustre需要经验丰富的工程师不同,即使是没有太多经验的系统管理员也可以安装并管理DT-HSS。研究表明,Dell&Terascala HSS可以同时为N对N(N-to-N)及N对1(N-to-1)文件访问模型提供非常大的吞吐量和IOPS。

  Dell&Terascala HPC 存储方案有其独到之处,单一操作界面简化了对整个存储系统进行端到端的操作与监控,单个全局命名空间允许你管理从少量到数百TB的数据。Dell&Terascala HPC 存储方案是完全捆绑的并经过了预先配置及测试。现场安装、配置和客户培训将为部署时间最小化提供帮助。

  Dell&Terascala HPC 存储方案提供的构件化(building block)设计使配置和扩展成为可能。每一个存储构件模块都可以提供高达192TB的裸容量,2.4GB/s的吞吐量。构件化方法意味着你可以轻松地设计出满足容量和性能要求的存储配置。在单个命名空间里Dell&Terascala HPC 存储方案的裸容量最小为48TB,最大可达数PB。

  主/主对象和主/被元数据服务器提供了最高的可用性和最出色的性能。DellPowerVault MD32x0存储阵列提供的主/主RAID控制器、热交换磁盘驱动器、冗余电源及风扇增强了存储的可用性和有效性。

  图7显示了48TB DT-HSS的一个简单配置。关键的硬件系统包括MDS、OSS和TMS1000管理设备,其中MDS和OSS节点通过QDR InfiniBand 连接到计算节点。

  MDS由两台Terascala存储服务器组成,这两台Terascala存储服务器采用主/被配置连接到Dell PowerVault MD3220存储阵列。PowerVault MD3220存储阵列的24块2.5英寸500GB Nearline SAS驱动器组成了RAID 10,提供了6TB的可用空间用于存储文件元数据信息。主/被配置克服了Lustre部署中常见的高可靠性缺陷,为元数据提供了高可用性和可靠性。该配置使用了高级监控及操作特性,在MDS发生故障时保证了快速、完整的故障切换,避免了元数据丢失。

  OSS由两台Terascala存储服务器以及采用主/主高可用配置进行交叉连接的两台Dell PowerVault MD3220存储阵列组成。主/主配置允许这两台服务器通过冗余路径访问存储阵列。通过DellMD3200阵列连接PowerVault MD1200阵列可以扩展存储容量。每一个对象存储节点至少可提供48TB的裸容量,最多可扩展至192TB。

HPC存储非常好的实践系列之:快速暂存方案
▲图1. Dell&Terascala HPC 存储方案 (HSS)

  Dell&Terascala HPC存储方案采用构件化设计,使用构件化模块可以很容易地设计出满足容量和性能需求的系统。随着使用时间越来越久,用户对于容量或性能的需求可能会增加,通过扩展构件化模块能够很容易满足用户的需求。例如,用户刚开始使用48TB的裸容量,包括24块硬盘驱动器(使用2TB Nearline SAS驱动器),吞吐量接近2.4GB/s。 Dell&Terascala HPC存储方案预先配置了48TB的裸容量并能够根据需求进行扩展,包括了全冗余元数据方案(两台Terascala服务器、一台MD3220)以及一个基对象(base object)(一对OSS服务器交叉连接到两台MD3200存储阵列)。随着时间的推移,如果容量需求增加,可以在MD3200后面增加PowerVault MD1200磁盘扩展柜来扩大容量。例如,每一台MD3200后面都可以增加一台由12块2TB Nearline SAS 驱动器组成的MD1200,这样总存储系统容量就可以达到96TB。如果初始性能要求总吞吐量高于2.4GB/s,或者随着时间的推移对吞吐量的要求更高,可以通过增加第二台对象服务器节点使总吞吐量和容量翻倍。例如,通过增加第二台48TB的OSS节点,可以设计出一个总吞吐量为4.8GB/s、总容量为96TB的系统。为使系统保持平衡,所有的OSS节点都应该具备相同存储容量。

  Dell&Terascala HPC存储方案包括三类网络。主数据网络是被计算节点所使用的QDR InfiniBand网络, Lustre文件系统的流量流经该网络。DT-HSS可以用四倍速率(QDR) 的IB 主机通道适配器 (host-channel adapters,HCA) 或 10Gb 以太网适配器进行配置。第二类网络是Terascala管理控制台用来收集来自DT-HSS组件的数据并向DT-HSS组件发送命令的以太网络,Terascala 管理控制台提供了简单、易操作的GUI来管理整个存储系统。第三类网络同样是以太网络,为MDS节点和OSS节点提供心跳,该心跳用于故障切换。

  完整的Dell&Terascala HPC存储方案通过使用Terascala管理控制台(Terascala Management Console,TMC)的TMS1000管理设备管理。图8显示了管理控制台的示意图。TMC提供了一个中央管理控制界面,可以对Lustre文件系统执行所有必要的操作。可以使用TMC手动执行Lustre指令但是没有必要成为一名Lustre文件系统专家,因为中央管理控台已经为你提供了操作界面。

HPC存储非常好的实践系列之:快速暂存方案
▲图2. Dell&Terascala HSS 管理控制台

  总之,Dell&Terascala HPC 存储提供了一个完整的可扩展、高性能的存储方案, 既可以轻松获取,部署及管理,又可以从Dell和Terascala得到全面的支持。Dell&Terascala HPC 存储可以根据用户的需求非常容易地扩展容量并提高性能,无需增加管理费用。请访问Dell&Terascala HSS网站获取Dell&Terascala HSS的详细配置信息。

  Dell&Terascala HSS性能

  本节描述Dell计算试验台(compute test bed)使用第二代 Dell&Terascala HPC 存储方案(DT-HSS-2)作为高吞吐量存储设备所进行的连续读/写性能测试。本测试使用基准测试程序IOzone测试了DT-HSS-2解决方案的大型连续读与连续写吞吐量。每个基准测试线程写入存储系统的不同文件时采用N对N存取方式。IOzone测试通过填满高速缓存计算节点、OSS服务器以及存储阵列的缓存(cache),将缓存的影响减少到最小。例如,每个IOzone线程使用48GB的文件进行大型连续写测试,下图显示了所得到的测试结果。测试基于配置了96TB裸容量的DT-HSS-2,它由两台主/主对象服务器组成。

HPC存储非常好的实践系列之:快速暂存方案
▲图3. HSS-2 N-to-N 连续读写性能

  上图表明对于96TB的配置,从4个并发请求/线程开始一直到64个并发请求/线程,连续写带宽一直保持在2600 MB/s左右,能够满足多数并行应用程序的I/O请求。连续写带宽从1400MB/s上升至2600 MB/s归功于Lustre文件系统使用InfiniBand网络传输流量。该图同时也表明从8个并发请求开始,在cold cache条件下(在每次连续读取测试之间均清除客户端和服务器缓存)连续读吞吐量达到了最大值,大约为2400 MB/s。在所有情况下,为了匹配Lustre 1MB大小的RPC数据包,请求的大小均设置为1024KB。

  推荐阅读:高性能计算专区

 

0
相关文章