服务器 频道

直面“双碳”挑战 盘点开放计算的四大创新举措

  据统计,2020年国内数据中心的总能耗突破了2千亿千瓦时,大概相当于三峡水电站的年发电量的两倍。如果折算成标准煤的燃烧发电,则意味着我们消耗了6千万吨煤,排放了1.6亿吨的二氧化碳。预计到2025年,中国数据中心的用电量会占整个社会用电量的4.05%。

  要知道,数据中心早已成为能耗大户,要实现最终的“双碳”目标,开放、标准化依然是整个产业界需要秉承的宗旨,这也是开放计算自创立之初就立下的“初心”。今天,我们就跟大家分享一下开放计算为降低能耗都做了哪些创新。

  整机柜是未来数据中心算力基础设施的主流形态

  开放计算的主要目标之一是优化机架中服务器的安装和运维。此外如何大规模的配置计算、存储、异构加速和网络资源以满足工作负载的需求,也是重要考量。

  整机柜的设计理念是将各功能区的供电、败热、管理集中化和模块化,便于快速交付、降低成本,正在替代传统的机架服务器成为大规模数据中心的主要选择。

  开放计算中最重要的贡献之一是OCP Open Rack技术规范的制定。Open Rack2.0可提高计算密度并提升能源效率,该设计已被互联网公司和电信运营商广泛使用,并为他们带来了实质性的投资回报。

  最新的OpenRack3.0将采用48V直流电源和液冷技术,机架高度从410U增加到440U,进一步提高数据中心的空间利用率,添加GPU等异构加速单元,以满足产业界对加速计算的需求。

  此外,ODCC社区开发的天蝎整机柜规范一直在推进数据中心服务器的模块化设计和大规模部署。

  天蝎1.0技术规范确立了集中供电、散热、管理的整机柜服务器形态。

  天蝎2.0进一步细化和改善,比如,将机柜内框拓展至21英寸,以增大可用空间;增强机柜背板功能,并可实现热插拔维护;服务器节点与机柜系统解耦,可实现服务器节点混插互换。

  天蝎3.0继续在高密、弹性计算需求上探索,在架构、供电、散热技术等方面持续优化;架构上充分考虑CPU/GPU/XPU/FPGA等处理器核心部件的适配,预留新部件的弹性扩展能力;供电上将机柜供电能力提升至33KW,散热上引入虹吸散热技术,实现高功率CPU的高效能风冷散热;同时机柜的设计充分考虑液冷模组的预留支持等。

  OpenRMC是开放计算规模化部署的重要推动力

  当数据中心的规模越来越大,基础设施的管理,算力的聚合、调度将扮演愈加重要的角色。机架管理控制(RMC)将管理从服务器、GPU服务器延伸到机柜中的部件,例如交换机、PDU和风扇等,且可进一步配合数据中心的资源管理计划。RMC将是实现开放计算设备规模化部署的重要推动力。

  OpenRMC工作组的核心理念是:明确、统一的管理将使最终客户更轻松地管理和维护各类厂商的设备并极大地降低系统管理成本。OpenRMC是协同合作如何发挥作用的典型实践。OpenRMC项目由浪潮牵头,其他贡献者包括Facebook、Microsoft、Google、HPE、Dell、Intel等。

  开放计算加速AI创新落地

  AI的飞速发展推动了一系列面向深度学习、机器学习等应用的异构加速方案的发展。异构加速系统的技术挑战和设计复杂性大,加速计算芯片多元化趋势明显,各厂商在开发中采用了不同的技术路线。

  芯片的接口、互联、协议上互不兼容,用户通常需要数月时间对不同平台进行测试,才能找到合适的方案,最终导致将加速芯片集成到计算系统中需要大约6~12个月,较长的开发周期阻碍了新技术的快速发展。

  OCP社区在服务器项目组下设立了OAI(Open AcceIeratorInfrastructure)项目组。该工作组旨在建立一整套可兼容各类Al加速器的技术标准,解决Al计算基础设施建设中硬件和生态分裂化的重大挑战。

  OAI工作组推进的开放技术规范涉及OAI、OAM、UBB、HIB等9大领域,涵盖结构设计、温度、管理、供电、硬件安全性、可用性等诸多方面,以促进不同Al加速器技术的开放融合及标准化,让Al计算硬件系统设计更加敏捷,产业配套更为简化。

  OAM是OAI项目组中进展最为迅速的领域。OAM设计规范定义了加速器模块互联形式和通用规范。与PCIe相比,OAM的互联通信通过简化模块间高速通信链路互连的系统解决方案,促进了各加速器的可扩展性。OAM规范的目标是实现加速器模块的标准化,简化人工智能基础架构设计,缩短面向Al协处理器的开发周期和实现大规模采用。

  开放标准促进边缘计算创新发展

  随着5G、物联网技术的快速发展,为了更加实时地分析和处理来自终端设备的海量数据并减轻网络传输的压力,缩短终端与服务器之间的通信距离,实现终端与服务器的高实时性交互,边缘计算迎来巨大的发展契机。

  在边缘部署的服务器的数量预计将在未来5年内翻倍,开放计算社区已经加大投入,提供专为在边缘部署而设计的IT设备。

  写在最后,开放计算一直强调的“普惠化”价值观。如果说之前开放计算更多服务于超大规模、大规模数据中心,服务于众多互联网巨头,那么未来伴随着数字化与智能化的发展,所有企业都需要云端的支持,需要边缘侧的配合,也需要一体化的解决方案与高效能数据中心的支撑,这也就意味着开放计算必将逐步渗透到更多的中小数据中心,并帮助这些数据中心实现“双碳”目标。

0
相关文章