科技·商业·财经

梁文锋执棋落子:DeepSeek以技术创新叩响十万亿美元AI硬件生态之门

   时间:2026-05-24 20:01 作者:快讯

近期,人工智能领域备受瞩目的DeepSeek动作不断,其一系列举措引发了行业内外广泛关注与深度思考。从融资动态到产品价格调整,再到背后隐藏的战略布局,这家公司正以独特的方式在AI赛道上疾驰。

彭博社消息显示,DeepSeek正在推进规模达700亿元人民币的融资,投前估值高达450亿美元。就在同一天,该公司宣布V4-Pro API永久降价75%,将促销价直接定为正价。一边向投资者寻求资金支持,一边向开发者大幅让利,这种看似矛盾的操作,让外界对DeepSeek的盈利模式充满疑惑。

有观点认为,DeepSeek的目标并非局限于当下常见的卖编程套餐、语音助手等业务。有博主在长文《DeepSeek's 10 trillion USD grand strategy》中大胆判断,DeepSeek真正的野心在于参与塑造一个价值10万亿美元级别的AI硬件生态,并在此生态中冲击万亿美元级估值。这一观点并非空穴来风,回顾DeepSeek的成长历程,会发现其每一步都走得与众不同。

在模型训练方面,当众多企业聚焦于堆Dense模型、卷参数量时,DeepSeek选择挑战最难训的MoE(混合专家模型),以更少的计算量撬动更高的智能。在强化学习算法上,别人采用PPO,DeepSeek则从第一性原理出发,发明了成本更低的GRPO算法。当行业还在讨论RLHF的天花板时,DeepSeek已跑通RLVR(基于可验证奖励的强化学习),将推理能力提升到新高度。MLA、DSA(解耦稀疏注意力)、mHC(流形约束超连接)、CSA和HCA等技术,都体现了DeepSeek在有限硬件条件下榨取最大AI算力的探索。

从具体技术细节来看,KV Cache的优化是DeepSeek的一大亮点。以100万token上下文、8bit KV精度、16bit索引精度为例,DeepSeek V4仅需5.48GBHBM,而其他顶级开源模型动辄需要60GBHBM。作为拥有1.6万亿参数的模型,DeepSeek V4的KV Cache占用仅为其他开源模型的零头。这使得DeepSeek能够将缓存命中的价格定在极低水平,V4-Pro缓存命中价仅0.025元/百万Token,不到Claude Sonnet 4.6同类价格的3%,且可持续缓存数小时。永久降价后,输入缓存未命中3元/百万Token,输出6元/百万Token,全部是原价的四分之一。DeepSeek创始人梁文锋两年前就提及的定价哲学“不贴钱,也不赚取暴利”,在此得到了印证,其成本优势源于对KV Cache的极致优化。

DeepSeek的种种“不做”也体现了其战略考量。它不做多模态(V4.1才开始试水图像和音频)、不做语音模型、不做视频模型,且API价格一降再降。这并非不会赚钱,而是不屑于赚当下的“快钱”。有类比指出,OpenAI拿到AMD和Cerebras的股权认购权证,通过“用承诺换股权”的方式,与芯片厂商共同做大蛋糕。DeepSeek可复制此模式,只不过其面对的是整条国产AI硬件产业链。梁文锋有量化基金背景,被称为“Jim Simmon的忠实粉丝”,对资本运作有着深刻理解。在融资消息传出前,他已完成关键股权调整,通过直接与间接持股控制公司约84.29%的股权,表决权达100%。宁德时代投资DeepSeek是为锁定未来AI数据中心的储能订单,京东、网易入局各有战略诉求,国家大基金下场更是将DeepSeek定位为国家级AI基础设施。这些投资者看中的,显然不是卖API的小生意,而是一个可能重塑全球AI硬件格局的战略支点。

不过,DeepSeek的目标不止于此。据彭博社报道,梁文锋在投资者会议上明确表示,DeepSeek的主要目标是推动技术边界,追求AGI。硬件生态只是手段,AGI才是最终目的。当更多硬件选择变得可用,算力需求被技术创新大幅压低,DeepSeek就能以更低成本启动更大规模的训练,尤其是强化学习(RL)后训练和递归自我改进(RSI)。大规模RL需要模型生成海量推理轨迹,万亿级token的生成量计算成本极高,而100万上下文的长程任务要求轨迹足够长。若没有极致的硬件效率优化,这种训练根本无法进行。RSI则更为大胆,让AI自己设计、执行、分析实验并改进自身,试错密度极高,对算力需求巨大。但DeepSeek通过重构硬件生态降低算力成本,使这条路变得可行。从MoE到MLA,从DSA到CSA,从Engram到TileLang,从KV Cache压缩到LPDDR流式加载,所有创新都指向让AGI的训练从“烧不起”变为“烧得起”。

 
 
更多>同类内容
全站最新
热门内容