滚动资讯

当前位置：网界 > 行业动态 > 正文内容

梁文锋执棋落子：DeepSeek以技术创新叩响十万亿美元AI硬件生态之门

时间：2026-05-24 20:01 作者：快讯

近期，人工智能领域备受瞩目的DeepSeek动作不断，其一系列举措引发了行业内外广泛关注与深度思考。从融资动态到产品价格调整，再到背后隐藏的战略布局，这家公司正以独特的方式在AI赛道上疾驰。

彭博社消息显示，DeepSeek正在推进规模达700亿元人民币的融资，投前估值高达450亿美元。就在同一天，该公司宣布V4-Pro API永久降价75%，将促销价直接定为正价。一边向投资者寻求资金支持，一边向开发者大幅让利，这种看似矛盾的操作，让外界对DeepSeek的盈利模式充满疑惑。

有观点认为，DeepSeek的目标并非局限于当下常见的卖编程套餐、语音助手等业务。有博主在长文《DeepSeek's 10 trillion USD grand strategy》中大胆判断，DeepSeek真正的野心在于参与塑造一个价值10万亿美元级别的AI硬件生态，并在此生态中冲击万亿美元级估值。这一观点并非空穴来风，回顾DeepSeek的成长历程，会发现其每一步都走得与众不同。

在模型训练方面，当众多企业聚焦于堆Dense模型、卷参数量时，DeepSeek选择挑战最难训的MoE（混合专家模型），以更少的计算量撬动更高的智能。在强化学习算法上，别人采用PPO，DeepSeek则从第一性原理出发，发明了成本更低的GRPO算法。当行业还在讨论RLHF的天花板时，DeepSeek已跑通RLVR（基于可验证奖励的强化学习），将推理能力提升到新高度。MLA、DSA（解耦稀疏注意力）、mHC（流形约束超连接）、CSA和HCA等技术，都体现了DeepSeek在有限硬件条件下榨取最大AI算力的探索。

从具体技术细节来看，KV Cache的优化是DeepSeek的一大亮点。以100万token上下文、8bit KV精度、16bit索引精度为例，DeepSeek V4仅需5.48GBHBM，而其他顶级开源模型动辄需要60GBHBM。作为拥有1.6万亿参数的模型，DeepSeek V4的KV Cache占用仅为其他开源模型的零头。这使得DeepSeek能够将缓存命中的价格定在极低水平，V4-Pro缓存命中价仅0.025元/百万Token，不到Claude Sonnet 4.6同类价格的3%，且可持续缓存数小时。永久降价后，输入缓存未命中3元/百万Token，输出6元/百万Token，全部是原价的四分之一。DeepSeek创始人梁文锋两年前就提及的定价哲学“不贴钱，也不赚取暴利”，在此得到了印证，其成本优势源于对KV Cache的极致优化。

DeepSeek的种种“不做”也体现了其战略考量。它不做多模态（V4.1才开始试水图像和音频）、不做语音模型、不做视频模型，且API价格一降再降。这并非不会赚钱，而是不屑于赚当下的“快钱”。有类比指出，OpenAI拿到AMD和Cerebras的股权认购权证，通过“用承诺换股权”的方式，与芯片厂商共同做大蛋糕。DeepSeek可复制此模式，只不过其面对的是整条国产AI硬件产业链。梁文锋有量化基金背景，被称为“Jim Simmon的忠实粉丝”，对资本运作有着深刻理解。在融资消息传出前，他已完成关键股权调整，通过直接与间接持股控制公司约84.29%的股权，表决权达100%。宁德时代投资DeepSeek是为锁定未来AI数据中心的储能订单，京东、网易入局各有战略诉求，国家大基金下场更是将DeepSeek定位为国家级AI基础设施。这些投资者看中的，显然不是卖API的小生意，而是一个可能重塑全球AI硬件格局的战略支点。

不过，DeepSeek的目标不止于此。据彭博社报道，梁文锋在投资者会议上明确表示，DeepSeek的主要目标是推动技术边界，追求AGI。硬件生态只是手段，AGI才是最终目的。当更多硬件选择变得可用，算力需求被技术创新大幅压低，DeepSeek就能以更低成本启动更大规模的训练，尤其是强化学习（RL）后训练和递归自我改进（RSI）。大规模RL需要模型生成海量推理轨迹，万亿级token的生成量计算成本极高，而100万上下文的长程任务要求轨迹足够长。若没有极致的硬件效率优化，这种训练根本无法进行。RSI则更为大胆，让AI自己设计、执行、分析实验并改进自身，试错密度极高，对算力需求巨大。但DeepSeek通过重构硬件生态降低算力成本，使这条路变得可行。从MoE到MLA，从DSA到CSA，从Engram到TileLang，从KV Cache压缩到LPDDR流式加载，所有创新都指向让AGI的训练从“烧不起”变为“烧得起”。

更多>同类内容

澜起科技股东上海融迎拟减持股份套现超30亿此前公司港股成功募资80亿港元

05-24

铝型材结构件定制选哪家？华光散热器以技术实力赋能多行业场景应用

05-24

第三方无损检测揭秘：TOPCon光伏组件性能优异，工艺成熟可靠性高

05-24

Meta再推新应用“Forum”：对标Reddit，能否在群组社交领域站稳脚跟？

官方表示，原有群组仍保留在 Facebook 平台，在论坛发布的内容也会同步展示在对应的 Facebook群组中。旗下多款新应用均模仿市面热门产品：Instants 借鉴了 BeReal 和 Snapcha…

05-24

AI写作新机遇：普通人如何借力AI在写作领域掘得首桶金？

05-24

2025百家号AIGC生态全景：技术赋能创作者，内容产业升级新图景

05-24

狄耐克携手中国联通厦门分公司 5G智慧病房落地助力医疗新升级

05-24

2026年4月全球AI工具市场洞察：流量回落下结构优化与垂直崛起并行

05-24

2026推拉门窗行业：系统化竞争下企业如何抉择与构建竞争力

05-24

2026郑州家纺柜市场全解析：工艺选择、定制避坑及服务商定位指南

05-24

简阳阿依郎25年匠心坚守川味冰粉借“冰经济”热潮畅销国内外

05-24

宏盛华源2025年研发投入1.44亿增18.35% 科技创新成果显著布局多元市场

05-24

中南传媒2025年研发投入缩减人员减少，数智转型成果与业绩表现并存

05-24

中国化学2025年研发投入67.17亿增1.03% 研发人员扩张至6815人成果丰硕

05-24

四方股份2025年研发投入7.32亿增7.80% 创新驱动业绩与研发双提升

05-24

点击查看更多 +

全站最新

特斯拉FSD中文名再调整监督版入华加速适配本土交通待突破

从夸克到千问：吴泳铭AI战略纠偏，阿里能否觅得超级入口新曙光？

华为AgentArts平台：智能体全周期运维新方案，破解黑盒优化效果

2025百家号AIGC生态全景：技术赋能创作者，内容产业升级正当时

清河羊绒企业如何借力阿里巴巴国际站冀南服务中心拓展跨境业务？

小红书联合飞猪发布：2026年五一出行新趋势，兴趣主导多元细分新体验

热门内容

本栏最新

网界 - 新财经新科技新未来 - 网界传媒旗下网站 - 中国 · 北京
合作咨询微信：netspread（注明:网界）
网界^®是本公司38类注册商标，是该商标的唯一持有者，未经授本公司授权，严禁使用。
Copyright © CNU 2012-2022 www.cnu.com.cn All rights reserved. 鲁ICP备2022032383号-6 鲁公网安备37010202700502号