滚动资讯

当前位置：网界 > 行业动态 > 正文内容

里程碑！昇腾910C完成1.6万亿大模型全参数后训练，国产算力跨过最难关

时间：2026-06-08 15:42 作者：格隆汇

近日，深圳河套学院联合哈工大（深圳）、深圳市大数据研究院及华为等团队，依托昇腾910C国产AI算力集群，成功完成1.6万亿参数大模型DeepSeek-V4-Pro的全参数后训练。

在美方制裁下，中国半导体正从基础的AI推理，正式迈向更复杂的模型训练阶段。正如官方通报所言，这印证了国产AI芯片足以支撑世界级超大参数模型的训练。这不是试探，而是实打实的里程碑——国产算力，终于跨过了那条最难的技术门槛。

为什么“全参数后训练”含金量这么高？

很多人只看到了“1.6万亿参数”，却没懂“全参数后训练”这六个字有多难。

AI大模型的核心分为推理和训练。推理是模型已经学好了，按部就班回答问题，这是国产芯片之前擅长的“单行道”；而训练则是让模型从零开始学，不仅需要海量算力，还要不断自我反思调整，相当于在单行道上建起复杂的“立交桥”。

训练又分预训练（打基础）和后训练（学规矩、学技能）。全参数后训练，意味着要同时调整1.6万亿个参数，而不是小打小闹的局部微调。更棘手的是，DeepSeek-V4-Pro采用了混合专家（MoE）架构——推理时只需唤醒少数专家，训练时却要所有专家同时学习、海量通信，数据交换量是普通模型的几十倍。

此前业内普遍认为，国产芯片根本扛不住这种级别的全参数训练。

三大硬核工程突破，把不可能变成可能

面对天堑，联合攻关团队靠的是三个扎扎实实的工程突破：

“显存拼图”：1.6万亿参数无法塞进任何单张卡。团队设计了极其精密的分布式承载方案，将模型像拼图一样拆分到每张芯片，数据交换时机分毫不差。

“负载均衡”：MoE架构最怕“忙闲不均”。团队针对性优化调度算法，动态分配任务，彻底解决了跨卡通信拥堵，大幅提升了算力利用率。

“全程不掉线”：大模型训练最怕中途崩溃，功亏一篑。此次训练跑了1500多步，全程零中断、零报错，背后是无数次调试打磨出的全链路监控与容错体系。

最终，模型算力利用率突破30%，关键训练算子效率提升14%。在万亿级训练领域，30%的利用率已是相当优秀的工业级水准（即便用顶配海外芯片，很多团队也仅在40%左右）。

比芯片突破更珍贵的，是实战人才

比技术突破更被低估的价值，是人才的孵化。

深圳河套学院将这次攻坚变成了真刀真枪的实兵演练场，让学生从环境搭建开始全程参与万亿级模型训练。目前已有42名学生参与，形成了“青年教师指导-博士生攻坚-工程团队支撑”的完整梯队。

大模型训练是一门工程科学，书本上学不到真经。之前没有高端算力平台，年轻人连摸一摸万亿集群的机会都没有。现在，这批知道哪里会出问题、知道怎么解决问题的实战工程师，才是国产AI产业最宝贵的财富。

写在最后

我们清醒地知道，国产算力在单卡性能和软件生态上，与世界顶尖水平仍有差距。但这次突破证明了：在海外垄断的大模型训练领域，我们不仅能做，而且能做好。

这不仅仅是一次技术的突围，更是一针强心剂。随着深圳河套学院等机构持续在长文本、AI智能体方向挖掘国产算力潜力，当越来越多的团队用国产芯片跑通大模型，属于国产AI的时代，才刚刚拉开序幕。

更多>同类内容

猿辅导“AI大阅读” 7 月上线，开启青少年沉浸式深度阅读时代

06-08

云原生应用管理再进化：Rainbond v6.9.0 正式发布，开启大模型私有化部署新纪元

06-08

顾全全确认离职字节Seed团队，曾主导SeedFold与Seed2.0训练体系建设

06-08

谷歌澄清 Chrome 搜索重定向至 AI 模式并非新计划

06-08

披着便利外衣的陷阱！国安部鸣枪警告：警惕“AI中转站”四大致命风险

06-08

告别单轮傻瓜问答！云知声发布原生智能体大模型U2，自主攻克百步复杂工作流

06-08

工作流迈向工程化！国内开源 AI 智能体 Runtime 框架 MateClaw 发布 v1.5.0 重磅更新

06-08

OpenCV 5 重磅发布：全新 DNN 引擎原生支持大模型，迈入大模型时代

06-08

能力与安全的博弈！OpenAI 上线 ChatGPT“封锁模式”，宁可断网也要防数据泄露

06-08

压轴题全押错？AI军团折戟 2026 高考作文，教育部发声反炒作

06-08

听听乱码就被“洗劫”？谷歌 Gemini 语音助理爆潜伏漏洞，黑客用特殊通知给 AI “下毒”

06-08

告别低效教学！知达 AI 用全闭环智能工具重构教育生产力

06-08

C盘空间瞬间释放4GB！谷歌浏览器终于服软，新版 Chrome 允许彻底禁用并删除本地 AI 大模型

06-08

“纯聊天模式已死”！OpenAI 酝酿史上最大改版，ChatGPT 转型“超级智能体”

06-08

百度MEG组织架构调整:升级数字人业务并成立大商业事业部

06-08

点击查看更多 +

全站最新

云知声U2大模型正式登场：多维度能力进阶，开启AI任务执行新范式

拼多多礼品代发：低价背后藏隐患，选对平台稳发货少补救才关键

华为云创想者大会：聚焦Agentic AI，深耕行业“黑土地”不拼Token总量

追觅科技俞浩微博遭禁言，过往争议言论引关注，签约文章亦被删除

从智能清洁到跨界造车手机，俞浩的多元化之路：理想照进现实还是“画饼”难圆？

华为“蒲公英计划”启航：携手全球伙伴共筑教育医疗智能新生态

热门内容

本栏最新

网界 - 新财经新科技新未来 - 网界传媒旗下网站 - 中国 · 北京
合作咨询微信：netspread（注明:网界）
网界^®是本公司38类注册商标，是该商标的唯一持有者，未经授本公司授权，严禁使用。
Copyright © CNU 2012-2022 www.cnu.com.cn All rights reserved. 鲁ICP备2022032383号-6 鲁公网安备37010202700502号