科技·商业·财经

小米MiMo对标DeepSeek发起价格战,借势突围能否赢得生态入场券?

   时间:2026-05-28 19:10 作者:格隆汇

国产大模型市场正经历一场由价格引发的深刻变革。小米近日宣布将MiMo-V2.5系列API价格永久下调,其中Pro版输入缓存命中价格降至0.025元/百万tokens,未命中场景输入价格为3元/百万tokens,输出价格为6元/百万tokens;普通版缓存命中价格更低至0.02元,未命中输入和输出分别为1元和2元。这一调整并非简单的市场促销,而是直接对标行业标杆DeepSeek的定价策略,标志着国产大模型竞争进入精细化成本管控的新阶段。

价格调整背后折射出大模型技术架构的深层进化。小米团队在公告中透露,此次降价得益于SGLang HiCache框架对Sliding Window Attention(SWA)的完整支持,通过优化KV Cache在GPU显存、CPU内存和SSD之间的调度效率,将数据搬运量降至原有水平的1/7,同时使可缓存token数量提升近5倍。这种技术突破使得缓存命中场景的成本出现断崖式下跌——以MiMo-V2.5-Pro为例,缓存命中输入价格较未命中场景低120倍,这种差异化定价策略精准匹配了Agent应用、代码生成等长上下文场景的特殊需求。

DeepSeek在此轮竞争中扮演着关键角色。其通过持续降价重新定义了行业价格基准,迫使其他厂商必须在性价比维度给出明确回应。对于尚未建立规模优势的新入局者而言,价格对标成为获取开发者注意力的有效手段。以小米MiMo为例,其核心用户群体并非独立模型调用方,而是手机、汽车、IoT等生态内的开发者。通过将价格压至与DeepSeek同一水平线,小米试图打破开发者对既有模型的路径依赖,为模型进入智能硬件控制、车机交互等场景创造入口。

技术团队面临的挑战在于平衡价格与可持续性。小米方面透露,当前定价策略下生产推理引擎已接近满负荷运转,但通过架构优化仍能维持收支平衡。这种谨慎态度源于对行业规律的深刻认知——此前有专家警告盲目降价可能导致亏损,但小米认为当模型架构与推理基础设施形成协同优化时,成本压缩可以转化为竞争优势。据悉,团队将在近期发布技术论文,详细阐述多级存储调度、专家并行计算等创新方案的具体实现路径。

这场价格博弈正在重塑国产大模型的市场格局。对于头部厂商而言,需要证明自身在性能、生态或稳定性方面的不可替代性;对于后来者,则必须抓住价格窗口期积累真实调用数据,为模型迭代提供养分。小米的选择折射出生态型企业的特殊逻辑——模型API只是中间形态,最终要融入智能硬件的交互体系。这种战略定位决定了其必须通过极致性价比获取初始流量,再通过生态协同实现价值闭环。当前的价格战或许只是序章,真正的较量将在数据反馈与模型优化的闭环中展开。

 
 
更多>同类内容
全站最新
热门内容