昇腾 + DeepSeek，重塑算力与模型新格局-服务器专区

昇腾 + DeepSeek，重塑算力与模型新格局

作者：陶然编辑：陶然 2025-02-20 09:47 IT168网站原创

　　在人工智能产业蓬勃发展的当下，技术创新与应用拓展成为推动行业前进的双轮。

　　DeepSeek与AI产业趋势洞察

　　DeepSeek自诞生以来，便以其优秀的技术创新能力在AI领域掀起波澜，加速了AI技术的普惠化进程。通过一系列工程创新举措，DeepSeek实现了训练效率提升2-3倍、推理效率提升5-7倍的显著成果。这一突破大幅缩短了模型开发和部署的时间成本，为全产业链变革注入了强大动力。

　　在模型创新层面，DeepSeek的出现加剧了前沿技术企业间的竞争。Meta、谷歌等头部AI公司纷纷加大投资力度，以维持自身的领先地位。与此同时，模型演进和技术迭代的速度也在不断加快，千问发布旗舰版模型Qwen 2.5 - Max、Google发布Gemini 2.0系列，都彰显了行业内的激烈竞争态势。而DeepSeek凭借其技术优势，在这场角逐中占据了重要位置。

　　在应用创新领域，DeepSeek同样表现出色。企业端（To B）对其展现出了极高的热情，在R1发布后的短短20天内（截至2月12日），国内外就有160多家企业集体接入，充分体现了其在商业应用中的巨大价值。在消费端（To C），DeepSeek更是引发了用户数量的爆炸式增长，超级APP的快速涌现加速了大语言模型（LLM）的全面普及，推动了新商业模式的形成，实现了商业的正循环。

　　DeepSeek之所以能够取得如此显著的成果，离不开其在全流程工程优化上的努力。在模型结构优化方面，相同硬件条件下，DeepSeek能够支持更大规模的模型，有效提升了模型的性能。计算通信优化则进一步提高了算力利用率，缩短了训练时间，让企业能够更高效地完成复杂的AI任务。后训练优化技术的应用，使得模型无需大量标注数据，在降低数据成本的同时，通过强化学习等技术提升了模型性能。推理优化让模型一次能够预测多个token，成倍提升了推理效率，为企业提供了更高效、更快速的AI应用体验。

　　值得注意的是，DeepSeek在提升性能的同时，还实现了成本的降低。其训练成本降低了60%，模型性能却提升了20%，通过充分发挥硬件的有效算力，加速了基础模型的创新迭代，减少了对原始人工标注数据的依赖。这一系列成果的背后，凸显了稳定可靠的算力底座对于模型创新的关键作用。对于绝大多数AI企业而言，拥有一个能够充分发挥有效算力的算力底座及完整解决方案，是实现高效训练和推理的基础。

　　昇腾是DeepSeek部署“更优解”

　　如今，大模型的发展呈现出“技术摸高 + 工程创新”并行的趋势。头部企业在预训练基础模型创新上坚定投入，追逐Scaling Law，加速探索通用人工智能（AGI）。他们对高效、稳定、开放的底座，极致性能、稳定可靠的AI集群，以及深度开放的平台和生态的关注度日益提升。

　　而新的范式则降低了后训练和蒸馏的门槛，引发了新一波的“百模千态”。企业在追求便捷、易用、性价比高的平台的同时，也更加注重兼顾成本与性能的蒸馏/微调方案，以及便捷的部署和敏捷的业务上线。在这样的趋势下，算力需求仍将持续增长。

　　在助力DeepSeek快速落地应用的过程中，昇腾一体机发挥了关键作用。它不仅支持DeepSeek快速上线，还能凭借高并发能力支撑客户生产系统，成为千行万业享受DS模型能力的优秀选择。与传统的硬件+社区模式相比，昇腾一体机具有性价比高、稳定性好的优势。目前，已有30多家软硬件伙伴基于昇腾推出了DeepSeek一体机方案，充分证明了其在市场上的受欢迎程度。

　　昇腾在与DeepSeek的合作中展现出了强大的适配能力。DeepSeek模型发布即原生支持昇腾，国内70%的客户、伙伴基于昇腾快速上线。截至2月12日，已有80多家客户/伙伴基于昇腾上线DeepSeek系列模型并对外提供服务，20多家正在进行适配测试，预计两周内全部上线。昇腾联合众多伙伴和客户，推出了丰富多样的产品和解决方案，涵盖互联网、金融、运营商、政务、教育等多个行业。

　　以硅基流动为例，作为昇腾软件伙伴，其基于昇腾底座取得了显著的成绩。在Deepseek-V3上线并开源后，双方展开了深入的联合创新。

　　魔乐社区与昇腾社区同步上线DS系列模型，下载量分别突破50万和8000，受到了用户的热烈欢迎。此外，昇腾助力20多个省、25个城市的人工智能计算中心（AICC）启动部署DS系列模型，使得全国超70%的区域可获取本地支持。

　　在训练能力上，昇腾表现卓越。它是业界首个适配完成DeepSeek核心算法的平台，支持DeepSeek全系模型的预训练及微调，尤其是对DeepSeek R1这种强化学习RL模型，昇腾超节点的支持优势明显。

　　昇腾还是业界唯一从预训练到微调全流程适配DeepSeek的AI训练平台，为行业模型训练从SFT微调走向强化学习训练方式提供了有力支持。通过提供“行业强化微调解决方案”，昇腾助力企业快速将DeepSeek强化学习技术应用到模型训练中，提升模型效果。同时，昇腾在功能、计算能力、通信算法、调度和并行能力等方面不断升级，为模型训练提供了全方位的保障。

　　推理能力方面，针对DeepSeek小专家创新架构带来的通信耗时及专家负载不均挑战，昇腾采用多卡并行推理+专家负载均衡技术，使DeepSeek模型推理吞吐性能提升30%以上。通过高效跨机互联、MoE专家通信优化、伪EP混合并行算法、稀疏路由稠密化算法等技术手段，昇腾有效降低了通信时延和专家不均衡度，提升了推理性能。

　　昇思MindSpore AI框架对DeepSeek的支持也至关重要。它支持DeepSeek-V3预训练、微调、推理全流程开箱即用，实现了天级复现。MindSpore Transformers大模型使能套件，为DeepSeek-V3的开发提供了端到端全流程、模块化的支持，加速了模型创新与行业落地应用。同时，该框架助力DeepSeek快速基于超大集群拉起分布式训练，通过丰富的分布式并行算法、集群仿真和自动调优等功能，保证了更稳定高效的MoE计算。

　　昇腾在软硬件协同和服务方面也为DeepSeek的部署提供了有力支持。昇腾全系硬件对DS系列模型的部署提供了良好的支持，训练硬件性能领先业界20%，推理硬件性能满足大部分客户需求，可达20TPS。全栈软件和工具实现了性能更优化，CANN提供深度优化的高性能算子库，MindStudio的modelslim工具插件可实现模型压缩，MindIE提供极简易用的推理加速服务。此外，昇腾还拥有专业的技术支持专家队伍和完善的AI计算使能&优化工具链，能够确保企业快速上线模型。

　　昇腾AI一直致力于打造开放的计算产业生态。在技术生态方面，硬件上引领架构创新，训练和推理方案不断创新，软件上深度开放，通过构建布道师体系等措施，赋能开发者。

　　目前，昇腾已发展330万开发者，联合72所高校发表超1700篇高级论文。在商业生态方面，昇腾联合众多硬件伙伴和行业合作伙伴，孵化了大量解决方案。昇腾原生计划的推出，通过多种激励方式，推动了原生算子、模型、应用等的开发，促进了产业生态的繁荣。

　　与其他厂商相比，昇腾在生态成熟度、行业解决方案、端边云协同、安全能力等方面具有显著的差异化优势。其完善的生态体系、与行业军团的深度绑定、同一架构覆盖云边端的无缝部署能力以及硬件级的安全保障，为企业提供了更优质的选择。

　　写在最后

　　昇腾与DeepSeek的合作，是AI产业发展中的一次重要探索。双方在技术创新、应用落地、生态构建等方面的深度融合，为AI产业的未来发展提供了新的思路和方向。随着合作的不断深入，相信它们将为千行百业的智能升级带来更多可能，推动AI产业迈向新的高度。

关注我们