随着大模型智能水平的提升,AIGC所需要的算力在不断增长。IDC预测,2022-2026年,全球AI计算市场规模将从195亿美元增长到346.6亿美元。其中,AIGC计算占整体AI计算市场的比例将从4.2%增长到31.7%。
如何提供高效算力已成为智能化发展的关键,作为算力输出底层载体的数据中心基础设施,承担着重要使命,也在千行百业智能化升级的热潮中面临前所未有的挑战。如何构建智能、绿色且高效的算力基础设施?未来计算技术和产业的发展将何去何从?
近日,2023年开放计算中国社区技术峰会(OCP China Day 2023)在北京举行。本届峰会由开放计算社区OCP主办、浪潮信息承办,以“Open Momentum:智能化、可拓展、可持续”为主题,汇聚了众多技术大咖、行业专家,聚焦数据中心基础设施创新、绿色计算、开放计算创新及产业生态、开放系统设计等话题。
会上,笔者有幸参加了“开放计算创新”分论坛,该论坛汇聚计算架构、芯片、AI、服务器等各领域专家,安谋科技、安晟培、燧原科技、龙蜥社区、奇异摩尔、浪潮信息、爱瑞无线等企业分享并探讨了各种前沿的创新技术、思考视角以及发展趋势。
Chiplet加速智算中心平台进化
数字经济与实体经济、数字世界与物理世界的深度融合,正在推动数据中心加快创新的速度。但日趋复杂的技术与推陈出新的应用,使得信息技术服务商与企业越来越难以驾驭数据中心的全面创新。
以全球化协作为核心宗旨的各类开源开放社区应运而生,并逐渐成为数据中心创新的重要力量。在技术创新上的独特模式与精妙的设计思维,是开放计算不断壮大的核心所在,而Chiplet作为一种新兴技术,也成为了开放计算领域的一大热点。
OCP基金会首席执行官George Tchaparian表示:Chiplet经济非常重要,OCP制定了开放式Chiplet经济的愿景,旨在通过建立一个强大的社区来围绕技术和业务工作流程提供真正开放经济所需的新标准化、工具和优秀实践,从而成为变革的催化剂。
鉴于全球基础设施的变化日新月异,为了因应行业持续增长的工作负载和不断攀升的性能需求,Arm 推出 Arm Neoverse处理器计算平台,专为面向数据中心、服务器、存储系统、网络设备等从云到边缘基础设施提供支持。
安谋科技服务器生态高级经理张伟在《Arm Neoverse平台演进》演讲中表示,凭借Arm架构在性能、能效、总拥有成本,以及灵活性等方面的技术优势,以及基于Arm技术的生态系统在云原生与基础设施软件的持续投入,Arm Neoverse 平台正为行业广泛采用,为广大生态伙伴在更节能的条件下,实现更好的性能,并带来更优异的成本经济性。
安谋科技始终致力于在全球标准上打造本土创新,一方面不断为产业引入顶尖技术,推动Arm CPU架构的本土化和生态化发展;同时贴合本土需求进行创新,打造NPU、CPU、SPU、VPU等自研业务产品矩阵,助力多元异构计算产业绿色、可持续、高质量发展。在Chiplet方面,Arm是UCIe的初创成员之一,Arm对UCIe兼容,对CXL也有很好的支持,都能做到灵活的连接,基于ARM对IO Die的互联做到无缝衔接,这样客户设计出来的芯片更加灵活,通过异构可以开发出适应不同场景的一些产品。
作为Chiplet 领域的代表性企业,奇异摩尔发表了《AIGC驱动数据中心加速进化,构建基于SoChiplet的智算中心平台》主题演讲。奇异摩尔联创兼产品及解决方案副总裁祝俊东先生在演讲中表示,AIGC作为当下最受关注的领域之一,为行业带来了更多应用的同时,也引发了数据中心和高性能芯片的算力、模型挑战。在算力需求的驱动下,更大规模的计算平台应运而生,进而引发更大规模,高效的数据调度挑战。
针对数据中心未来的挑战,奇异摩尔基于Chiplet架构,以互联为中心,构建了一个超大规模分布式异构平台的底座,为大规模分布式异构平台解决互联问题。该架构全面支持2.5D/3D互联,Die-to-Die,chip-to-chip,甚至数据中心级别的互联。
大模型的发展,挑战很多,但方法也很多。Chiplet作为一种底层技术,通过实现多Die的协同,有助于解决算力和功耗的矛盾。奇异摩尔希望基于OCP平台,通过开放的标准接口,构建一个开放的芯片生态,支持软硬件平台的发展,让算力变得更简单,降低高性能计算的门槛,帮助企业更容易的制造下一代的智算中心。
高速互联+边缘计算 助力数据流转
生成式AI是当下最受关注的技术领域之一,燧原科技产品系统Fellow俞武发表了《AIGC新业务对OAI系统的IO互联和集群组网的需求和挑战》的演讲,分享了在AI大模型应用场景下的打造一个集合计算、存储、网络、管理,深度优化且可开箱即用的系统集群的必要性,同时指出OAI异构系统的创新性、分层迭代和更灵活的组网方式,可以快速赋能大模型的应用和发展。
在软硬协同发展思想的推动下,开源软件和开放硬件正加快融合,开放开源技术将深刻改变全球IT产业分工协作模式。未来,越来越多的跨社区合作将进一步打破创新的边界,以更加开放的数据中心为业务创新赋予无限可能。
算力下沉到边缘侧,解决业务痛点,需要整个生态链的成员协同合作,形成可复制的方案,打开新的产业格局。在布局交通领域的路侧边缘计算的同时,浪潮信息也在拓展车载计算。
浪潮信息IEI自动驾驶首席架构师张清在题为《自动驾驶计算创新:从域控制器EIS400到软件框架AutoDRRT》的演讲中表示,浪潮信息智能域控制器EIS400,能够为智能驾驶提供数据中心级强大、安全、高效的车载边缘算力。
不仅如此,浪潮信息还拥有自动驾驶计算框架AutoDRRT基于高度开放的EIS400,可为用户提供自动驾驶感知、规划决策、控制算法API接口、计算并行与加速模块和开发工具,加速智能驾驶行业快速发展。
AutoDRRT具有分布式、高容错、低延时三大计算创新功能。其中,分布式计算功能面向用户自动驾驶应用快速迁移的需求,支持从单计算引擎到多计算引擎的分布式并行计算,用户无需代码开发,即可实现上百个不同算法在5个计算引擎上的分布式计算。
为解决应用层的安全运行,AutoDRRT还设计了高容错计算功能,实现了计算、通信、IO的冗余,当某一自动驾驶算法如果由于系统故障失效,可实时切换到冗余算法,切换延时低至1ms,从而保障系统安全。
此外,低延时计算功能,采用软硬件协同优化技术,解决应用运行的低延时挑战,实现自动驾驶应用从感知到控制的端到端延时低至60ms,比行业内应用运行的平均时延降低40%,可以更好的满足自动驾驶对实时性的要求。
在人工智能、5G等技术的驱动下,边缘场景日益丰富,用户需要更灵活、更容易部署的解决方案以应对边缘侧持续增长的工作负载。
成都爱瑞无线科技有限公司产品总监陈鑫在《爱瑞无线超融合AI+5G边缘计算平台》的演讲中表示,AI+5G是网络与算力的深度融合,可以广泛应用于工业互联网、智能制造、智慧物流等多行业场景中,推动企业级应用迅速爆发,进一步丰富工业元宇宙生态。
对此,爱瑞无线推出了AI+5G边缘算力平台,利用GPU算力实现5G基带系统的全软件定义,在开放式架构设计、软硬件解耦方面进行了系列创新,为开放计算在行业应用的发展提供了新思路和新动能。结合爱瑞无线的前传交换机和射频单元,整套系统通过AI与5G共享GPU算力资源,并根据两者对算力的需求, 动态调整算力分配, 大幅提升资源利用效率。同时搭载高清摄像头、AR/VR眼镜以及多种工业终端,实现多样应用场景,为企业实现降本增效。
未来,爱瑞无线期待与行业合作伙伴共同推进AI和5G的融合,使各行各业都能够利用5G高效的网络以及各类AI算法,充分挖掘5G的潜力,提升行业对5G应用的用户体验。
开放计算助力数据中心可持续发展
伴随着数字经济发展,云计算推动数据中心的快速发展,基于传统技术创建可持续的数据中心面临许着多挑战,比如能耗和碳排放。如何借助开放计算技术减少数据中心的碳足迹,以更低的功耗提供更强算力成为业界关注的焦点。
Ampere Computing产品市场总监孙开本在《可持续的数据中心始于高效计算》的演讲中表示,解决数据中心的能耗问题,CPU是关键。如果CPU能够以更低的功率提供更高的性能和更高的容量,就可以减少数据中心整体资源消耗压力。
据介绍,Ampere云原生处理器所具备的高度线性可扩展性,没有递减效应,能够一直扩展到128个甚至更多内核。这使客户能够以高达100%的利用率运行,而不是30%到50%的水平,从而能够适应峰值容量需求。
在与OCP合作方面,开源席卷业界,2021年,Ampere向OCP捐献了Mt Jade平台,提供硬件和固件,助力企业可以轻松地在云原生平台上进行创新。同时,Ampere还参与到DC-MHS 2.0,并为其做出积极贡献,这种类型的互操作性将助力颠覆性技术的加速创新。
作为面向国际的Linux服务器操作系统开源根社区,龙蜥致力于立足云计算打造数字创新基石,凝聚整个产业的生态力量,共创数字化发展打造开源新基建。龙蜥社区产品生态总监张鹏程在题为《同走龙蜥开源特色路,共创云时代代数智计算基石》的分享中表示,操作系统的建设并非一蹴而就,要想打造自己的操作系统,需要在技术、标准、生态等维度多管齐下。
上个月,龙蜥社区宣布推出自研的根发行版Anolis OS 23,也是首款全面拥抱智算的国内操作系统。据介绍,该版本顺应云计算+AI的创新需求。技术上坚持独立选型自主演进,全面支持智能计算,引入了一系列AI组件和框架,以及提供双内核支持和云上场景的软件包,进一步提升了操作系统的兼容性和稳定性。
未来,龙蜥社区将汇聚更多产业力量共建可持续自主演进能力,与产业伙伴浪潮信息联合创新开源开放,推动国产操作系统产业发展。
笔者观察
作为开放计算领域生态覆盖最广且最具影响力的亚洲最大年度技术峰会,OCP China Day迄今已成功举办5届。开放计算正成为当前乃至未来数据中心的创新主力,不断打破数据中心创新的边界,使得更多的技术得以融合。
未来,围绕开放计算所展开的全球协作与共同创新,将为开放计算的发展注入源源不断的活力,并进一步推动数据中心产业的高质量发展。