科技·商业·财经

小米MiMo借DeepSeek“东风”降价,能否在AI市场成功突围?

   时间:2026-05-28 16:04 作者:快讯

国产大模型市场正经历一场由价格驱动的深刻变革。小米近期宣布对MiMo-V2.5系列API实施永久性调价,其中Pro版本输入缓存命中价格降至0.025元/百万tokens,未命中场景仍保持3元/百万tokens,输出价格则为6元/百万tokens。普通版价格更具竞争力,缓存命中场景低至0.02元,未命中输入和输出分别定价1元和2元。这一举措被业界视为对DeepSeek近期降价策略的直接回应,标志着国产大模型竞争进入白热化阶段。

价格体系重构背后,反映的是技术架构的深度优化。小米团队透露,此次降价得益于SGLang HiCache框架对滑动窗口注意力机制(SWA)的完整支持,通过优化KV Cache在GPU显存、CPU内存与SSD之间的调度效率,将数据搬运量压缩至原有水平的1/7,同时使可缓存token数量扩大近5倍。这种技术突破使得缓存命中场景的成本结构发生根本性改变——以MiMo-V2.5-Pro为例,未命中输入与缓存命中输入的价格差距达120倍,精准体现了不同计算场景的成本差异。

行业观察人士指出,大模型定价策略正在从"统一商品"模式转向"场景化定价"。随着Agent应用、代码生成、知识库管理等长上下文场景的普及,输入内容重复率显著提升。某代码助手平台数据显示,其日常调用中超过60%的输入请求包含相同的前缀内容。这种特性使得缓存技术成为降低推理成本的关键杠杆,厂商开始根据"新输入"、"缓存输入"、"输出token"等不同维度制定差异化价格体系。

DeepSeek的定价策略已成为国产大模型市场的基准线。该品牌通过持续降价重新定义了行业价格锚点,迫使其他厂商必须在性能、速度、稳定性或生态优势等方面提供超额价值。对于尚未建立用户规模的新入局者而言,价格对标成为获取市场注意力的最直接手段。小米选择在DeepSeek最新调价后迅速跟进,正是看中价格敏感型开发者在任务调用成本上的高度关注——在长对话、多轮Agent等场景中,微小的单价差异经累计后可能形成显著的成本差距。

技术降本与商业策略的双重驱动下,模型厂商面临新的生存法则。具备自研推理引擎优化能力的企业,能够通过架构创新维持盈利空间;而缺乏技术壁垒的厂商则可能被迫退守多模态、端侧部署等细分领域。小米的特殊之处在于其生态布局——MiMo模型不仅需要独立获取开发者认可,更要承担起连接手机、汽车、IoT设备等终端的AI基础能力重任。这要求模型在真实场景中持续获得调用数据,通过用户行为反馈迭代优化特定功能接口。

据内部人士透露,小米生产推理引擎在降价后已接近满负荷运转,但仍保持收支平衡。该团队负责人强调,此前反对盲目降价的立场基于行业现实——多数模型架构缺乏足够的计算优化支撑低价策略。此次调价建立在KV缓存架构革新与推理基础设施升级的基础上,若能推动行业形成技术降本与价格竞争的良性循环,将重新定义大模型市场的竞争维度。不过,这种平衡能否持续维持,仍需观察实际调用量增长后的成本变化趋势。

 
 
更多>同类内容
全站最新
热门内容