在人工智能产业蓬勃发展的当下,技术创新与应用拓展成为推动行业前进的双轮。
DeepSeek与AI产业趋势洞察
DeepSeek自诞生以来,便以其优秀的技术创新能力在AI领域掀起波澜,加速了AI技术的普惠化进程。通过一系列工程创新举措,DeepSeek实现了训练效率提升2-3倍、推理效率提升5-7倍的显著成果。这一突破大幅缩短了模型开发和部署的时间成本,为全产业链变革注入了强大动力。
在模型创新层面,DeepSeek的出现加剧了前沿技术企业间的竞争。Meta、谷歌等头部AI公司纷纷加大投资力度,以维持自身的领先地位。与此同时,模型演进和技术迭代的速度也在不断加快,千问发布旗舰版模型Qwen 2.5 - Max、Google发布Gemini 2.0系列,都彰显了行业内的激烈竞争态势。而DeepSeek凭借其技术优势,在这场角逐中占据了重要位置。
在应用创新领域,DeepSeek同样表现出色。企业端(To B)对其展现出了极高的热情,在R1发布后的短短20天内(截至2月12日),国内外就有160多家企业集体接入,充分体现了其在商业应用中的巨大价值。在消费端(To C),DeepSeek更是引发了用户数量的爆炸式增长,超级APP的快速涌现加速了大语言模型(LLM)的全面普及,推动了新商业模式的形成,实现了商业的正循环。
DeepSeek之所以能够取得如此显著的成果,离不开其在全流程工程优化上的努力。在模型结构优化方面,相同硬件条件下,DeepSeek能够支持更大规模的模型,有效提升了模型的性能。计算通信优化则进一步提高了算力利用率,缩短了训练时间,让企业能够更高效地完成复杂的AI任务。后训练优化技术的应用,使得模型无需大量标注数据,在降低数据成本的同时,通过强化学习等技术提升了模型性能。推理优化让模型一次能够预测多个token,成倍提升了推理效率,为企业提供了更高效、更快速的AI应用体验。
值得注意的是,DeepSeek在提升性能的同时,还实现了成本的降低。其训练成本降低了60%,模型性能却提升了20%,通过充分发挥硬件的有效算力,加速了基础模型的创新迭代,减少了对原始人工标注数据的依赖。这一系列成果的背后,凸显了稳定可靠的算力底座对于模型创新的关键作用。对于绝大多数AI企业而言,拥有一个能够充分发挥有效算力的算力底座及完整解决方案,是实现高效训练和推理的基础。
昇腾是DeepSeek部署“更优解”
如今,大模型的发展呈现出“技术摸高 + 工程创新”并行的趋势。头部企业在预训练基础模型创新上坚定投入,追逐Scaling Law,加速探索通用人工智能(AGI)。他们对高效、稳定、开放的底座,极致性能、稳定可靠的AI集群,以及深度开放的平台和生态的关注度日益提升。
而新的范式则降低了后训练和蒸馏的门槛,引发了新一波的“百模千态”。企业在追求便捷、易用、性价比高的平台的同时,也更加注重兼顾成本与性能的蒸馏/微调方案,以及便捷的部署和敏捷的业务上线。在这样的趋势下,算力需求仍将持续增长。
在助力DeepSeek快速落地应用的过程中,昇腾一体机发挥了关键作用。它不仅支持DeepSeek快速上线,还能凭借高并发能力支撑客户生产系统,成为千行万业享受DS模型能力的优秀选择。与传统的硬件+社区模式相比,昇腾一体机具有性价比高、稳定性好的优势。目前,已有30多家软硬件伙伴基于昇腾推出了DeepSeek一体机方案,充分证明了其在市场上的受欢迎程度。
昇腾在与DeepSeek的合作中展现出了强大的适配能力。DeepSeek模型发布即原生支持昇腾,国内70%的客户、伙伴基于昇腾快速上线。截至2月12日,已有80多家客户/伙伴基于昇腾上线DeepSeek系列模型并对外提供服务,20多家正在进行适配测试,预计两周内全部上线。昇腾联合众多伙伴和客户,推出了丰富多样的产品和解决方案,涵盖互联网、金融、运营商、政务、教育等多个行业。
以硅基流动为例,作为昇腾软件伙伴,其基于昇腾底座取得了显著的成绩。在Deepseek-V3上线并开源后,双方展开了深入的联合创新。
魔乐社区与昇腾社区同步上线DS系列模型,下载量分别突破50万和8000,受到了用户的热烈欢迎。此外,昇腾助力20多个省、25个城市的人工智能计算中心(AICC)启动部署DS系列模型,使得全国超70%的区域可获取本地支持。
在训练能力上,昇腾表现卓越。它是业界首个适配完成DeepSeek核心算法的平台,支持DeepSeek全系模型的预训练及微调,尤其是对DeepSeek R1这种强化学习RL模型,昇腾超节点的支持优势明显。
昇腾还是业界唯一从预训练到微调全流程适配DeepSeek的AI训练平台,为行业模型训练从SFT微调走向强化学习训练方式提供了有力支持。通过提供“行业强化微调解决方案”,昇腾助力企业快速将DeepSeek强化学习技术应用到模型训练中,提升模型效果。同时,昇腾在功能、计算能力、通信算法、调度和并行能力等方面不断升级,为模型训练提供了全方位的保障。
推理能力方面,针对DeepSeek小专家创新架构带来的通信耗时及专家负载不均挑战,昇腾采用多卡并行推理+专家负载均衡技术,使DeepSeek模型推理吞吐性能提升30%以上。通过高效跨机互联、MoE专家通信优化、伪EP混合并行算法、稀疏路由稠密化算法等技术手段,昇腾有效降低了通信时延和专家不均衡度,提升了推理性能。
昇思MindSpore AI框架对DeepSeek的支持也至关重要。它支持DeepSeek-V3预训练、微调、推理全流程开箱即用,实现了天级复现。MindSpore Transformers大模型使能套件,为DeepSeek-V3的开发提供了端到端全流程、模块化的支持,加速了模型创新与行业落地应用。同时,该框架助力DeepSeek快速基于超大集群拉起分布式训练,通过丰富的分布式并行算法、集群仿真和自动调优等功能,保证了更稳定高效的MoE计算。
昇腾在软硬件协同和服务方面也为DeepSeek的部署提供了有力支持。昇腾全系硬件对DS系列模型的部署提供了良好的支持,训练硬件性能领先业界20%,推理硬件性能满足大部分客户需求,可达20TPS。全栈软件和工具实现了性能更优化,CANN提供深度优化的高性能算子库,MindStudio的modelslim工具插件可实现模型压缩,MindIE提供极简易用的推理加速服务。此外,昇腾还拥有专业的技术支持专家队伍和完善的AI计算使能&优化工具链,能够确保企业快速上线模型。
昇腾AI一直致力于打造开放的计算产业生态。在技术生态方面,硬件上引领架构创新,训练和推理方案不断创新,软件上深度开放,通过构建布道师体系等措施,赋能开发者。
目前,昇腾已发展330万开发者,联合72所高校发表超1700篇高级论文。在商业生态方面,昇腾联合众多硬件伙伴和行业合作伙伴,孵化了大量解决方案。昇腾原生计划的推出,通过多种激励方式,推动了原生算子、模型、应用等的开发,促进了产业生态的繁荣。
与其他厂商相比,昇腾在生态成熟度、行业解决方案、端边云协同、安全能力等方面具有显著的差异化优势。其完善的生态体系、与行业军团的深度绑定、同一架构覆盖云边端的无缝部署能力以及硬件级的安全保障,为企业提供了更优质的选择。
写在最后
昇腾与DeepSeek的合作,是AI产业发展中的一次重要探索。双方在技术创新、应用落地、生态构建等方面的深度融合,为AI产业的未来发展提供了新的思路和方向。随着合作的不断深入,相信它们将为千行百业的智能升级带来更多可能,推动AI产业迈向新的高度。