罗福莉小米首秀：MiMo大模型开源登场，小米AI锚定物理世界与普惠之路

时间：2025-12-17 19:10 作者：唐云泽

在北京小米“人车家全生态”合作伙伴大会的现场，展区展台被热情的观众围得水泄不通，人群的讨论声与相机的快门声此起彼伏。这场备受瞩目的生态盛会，焦点并非缺席的创始人雷军，而是首次以小米MiMo大模型负责人身份亮相的罗福莉。这位曾经的DeepSeek核心成员，凭借一场虽略显紧张却充满洞见的演讲，不仅为小米的AI战略翻开了新的篇章，更引发了业界对人工智能发展方向的深入思考。

罗福莉在演讲中以独特的视角重新诠释了AI的发展路径。她将AI的演进比作人类大脑6亿年的进化历程，认为当前大模型的“智能跃迁”并非偶然。她指出，语言作为人类思维与物理世界的符号投影，正是大模型能够解析文本思维轨迹的关键。这一认知促使小米选择从语言领域切入，成功打造了Agent语言基座模型MiMo-V2-Flash。该模型虽在参数规模上不占优势，却在全球开源模型代码与Agent测评基准中脱颖而出，位列前二。其核心突破在于“极致推理效率”：通过Hybrid SWA架构固定KV Cache以增强长文推理能力，并借助3层MTP推理加速并行Token验证，使推理速度提升2至2.6倍，实现了“低成本+高速度”的双重优势。现场演示中，该模型展示了编写简易操作系统、模拟太阳系运行轨迹等能力，初步展现了“模拟世界”的潜力。

罗福莉对AI“护城河”的定义引发了广泛关注。她认为，算力和数据并非决定性因素，真正重要的是科学的研究文化与方法，以及将未知问题转化为可用产品的能力。她直言，当前部分AI模型仍停留在“语言模拟器”阶段，缺乏与物理世界的深度交互，这可能导致“空中楼阁”式的风险。她强调，AI进化的下一个关键节点，在于构建能够与物理世界互动的模型。这一观点与OpenAI联合创始人Ilya的“语言可实现终极AGI”观点形成鲜明对比，凸显了小米“务实主义”的技术路线——通过多模态感知（Omni感知）将大模型嵌入智能终端，融入工作流，从而理解物理规律与世界逻辑。她还透露，小米大模型Core团队由研究、产品与工程人员深度耦合组成，虽规模不大但充满创业精神，这与她强调的“技术转化能力”高度契合。

小米集团合伙人、总裁卢伟冰在大会上披露的业务数据，为罗福莉的AI蓝图提供了坚实的支撑。2025年前三季度，小米收入突破3400亿元，同比增长32.5%，经调整利润增长73.5%；1至10月在中国手机市场销量稳居第二。核心业务的稳健增长，为技术研发提供了“压舱石”。更引人注目的是，小米未来五年计划投入超2000亿元用于研发，2026年单年投入预计达400亿元左右，重点聚焦芯片、OS、AI三大核心技术。这些技术正是小米“人车家全生态”的底层支柱。卢伟冰详细拆解了该生态的构成：产品端涵盖个人设备（手机、PC等）、出行设备（汽车）、家庭设备（IoT）；技术端以芯片、OS、AI为核心驱动力；制造端依托手机、汽车、大家电工厂实现落地。这种“全链路覆盖”的生态，为MiMo大模型提供了丰富的应用场景——从手机端侧推理到汽车智能交互，再到家庭IoT设备联动，大模型得以在真实场景中不断迭代优化。

演讲尾声，罗福莉宣布了一项重大决策：MiMo-V2-Flash将全面开源，包括模型权重、技术报告，并提供限时免费的API服务。这一举措源于她对“开源价值”的深刻理解。她认为，开源本质上是一种分布式的技术加速机制。她回忆道，早期开源模型与顶尖模型存在三年代差，如今差距已缩短至数月，这充分证明了开源对技术普惠的推动作用。在她看来，开源是实现AGI普惠化的唯一路径，能够避免技术被少数主体垄断，促进全球开发者协作，共同补全AI的“演化拼图”。这一决策不仅展现了小米的技术自信，也可能重塑行业格局——中小开发者无需再为基础模型研发投入巨额成本，可基于MiMo-V2-Flash聚焦场景化创新，与小米“人车家生态”的开放合作理念形成闭环。

从罗福莉11月12日官宣加入小米，到12月16日MiMo-V2-Flash发布，再到17日首次公开演讲，短短一个月内，小米大模型团队的快速落地，印证了其“研究-产品-工程”耦合的团队优势。随着2000亿研发投入的逐步实施，以及人车家生态的持续深化，小米的AI路径或许将成为观察“技术如何从理论走向现实”的典型案例。毕竟，在AI的“进化重演”中，唯有扎根场景、开放协作，才能避免“空中楼阁”，真正走向理解世界的智能。

更多>同类内容

得物、唯品会、小红书角逐“她经济”：各展所长，谁能破局“不可能三角”？

12-17