服务器 频道

北师大采用浪潮AS3000承载海量地表数据

  【IT168 案例】导语:人类面临最大的威胁是什么呢?不是机器人,也不是外星人,其实是我们生存的环境。作为“拯救地球”的真实写照,北京师范大学的地表过程与资源生态国家重点实验室以高性能计算和海量存储系统构建IT基础设施,对北方半干旱草地、农牧交错带和海岸带进行了重点研究;其中浪潮AS3000海量存储系统以8个冗余控制器、500TB容量、6GB带宽,给生态系统可持续管理和退化生态系统的恢复重建提供了海量数据平台。

  “八年”数据怎么存?实验室发展遇到大问题

  地表过程与资源生态国家重点实验室(北京师范大学)成立于2007年10月,设有地表过程、资源生态、地表系统模型与模拟及区域可持续发展模式四大研究方向,拥有分析测试中心、模拟计算中心,以及北京房山综合实验基地、河北黄骅野外试验站、河北怀来野外试验站、黑龙江九三野外试验站等4个野外基地,为生态脆弱地区土地退化防治和退化生态系统恢复提供系统的技术支持。

北师大采用浪潮AS3000承载海量地表数据
▲AS3000承载地表过程与资源生态国家重点实验室的海量数据

  从实验室成立到快速发展,一线研究人员采集的数据、研究资料和成果已经超出原有存储系统的负载上限,存储系统必须要全面升级,才能确保历史数据和新研究项目的顺利开展。

  对此,实验室技术负责人表示:“海量存储作为大规模生态数据的载体,需要具有极高的数据响应速度和聚合带宽,结合前端的高性能计算系统,可全面提升了实验室研究工作的效率和准确性。同时,多年保存下来的生态数据具有很高的科研价值,一旦发生数据丢失将造成巨大经济损失和资源的浪费。因此,在实现高性能的同时必须确保存储系统的高可靠性。”

  基于高可靠的集群架构,AS3000让业务跑得更快、更稳、更自如

  根据实验室现有数据容量评估,以及研究工作中计算量大、通讯密集、数据保密性强的特点,结合前端高性能主机的性能,浪潮提出利用AS3000来完成任务。

  “在选型阶段,这款分布式架构的产品给我们留下了深刻印象,AS3000控制器集群采用了全冗余架构设计,具有了自动负载均衡和故障自动切换等功能。同时,在带宽方面,还能满足实验室开放课题环境下,多用户、多并发的高性能需要。”该负责人对浪潮AS3000能够符合高性能计算平台整体需求非常满意。而随着项目的落地,AS3000身上的许多技术特色,也在这所优异重点实验室发挥出来。

北师大采用浪潮AS3000承载海量地表数据
▲AS3000海量存储系统

  首先,针对实验室8年间积累的历史数据,浪潮AS3000独特的高性能、集群架构可实现多控制器的数据并发读写,控制器还可根据用户需求灵活地实现在线扩展。在本次项目中,浪潮AS3000配置8个冗余控制器和500TB的容量,在保证前端高性能计算的高带宽要求的前提下,能够高效、合理的整合用户目前的存储网络架构,统一部署和集中管理,降低能耗,降低整体拥有成本(TCO)。另外,在AS3000多种扩展方式中,实验室选择了浪潮工程师推荐的“scale-out”方式,即增加数据节点的数量和后端SAN整列的数量,达到性能和容量随节点增加线性增长的目标,满足实验室IT能力扩展的规划。

  其次,在性能方面,前端主机通过双FC交换网络连接到AS3000控制器,链路冗余充分保障其中一条网络链路故障不影响系统应用。项目完成后,系统可提供高达6GB的聚合带宽和在线5000的IOPS,轻松满足实验室内部和外界课题申请人员在线读取数据。

  最后,针对实验室高性能计算平台的高可靠性要求,本方案采用了Active-Active控制器工作模式,任何一个控制器发生故障系统都无需重建数据,且不影响数据的IO会话,最大程度的保障存储系统的IO性能,确保数据存取及业务运行万无一失。其次,在数据安全保护方面,AS3000支持数据卷隔离映射、快照回滚、远程卷复制(同步/异步)、远程数据复制及恢复、逻辑分区动态扩容等功能,在保证前端高性能计算的高带宽要求的前提下,实现了系统的多节点冗余与数据安全可靠性。

  海量存储“就位”,促进生态可持续发展

  据了解,地表过程与资源生态国家重点实验室是以北方半干旱草地与农牧交错带及海岸带为重点,这对于强化生态文明,共建美丽中国意义重大。

  “实验室研究的脆弱地区生态环境数据,是国家可持续发展中改善工作的基础。而科考设备升级、高性能计算平台更新换代、海量高可靠存储设备系统‘就位',这些技术上的保障为探索科学前沿、解决国家重大需求和人才培养等领域的发展,都起到了非常积极的促进作用。”该实验室负责人表示。

7
相关文章