科技·商业·财经

罗福莉小米首秀:MiMo大模型开源登场,小米AI锚定物理世界与普惠之路

   时间:2025-12-17 19:10 作者:唐云泽

在北京小米“人车家全生态”合作伙伴大会的现场,展区展台被热情的观众围得水泄不通,人群的讨论声与相机的快门声此起彼伏。这场备受瞩目的生态盛会,焦点并非缺席的创始人雷军,而是首次以小米MiMo大模型负责人身份亮相的罗福莉。这位曾经的DeepSeek核心成员,凭借一场虽略显紧张却充满洞见的演讲,不仅为小米的AI战略翻开了新的篇章,更引发了业界对人工智能发展方向的深入思考。

罗福莉在演讲中以独特的视角重新诠释了AI的发展路径。她将AI的演进比作人类大脑6亿年的进化历程,认为当前大模型的“智能跃迁”并非偶然。她指出,语言作为人类思维与物理世界的符号投影,正是大模型能够解析文本思维轨迹的关键。这一认知促使小米选择从语言领域切入,成功打造了Agent语言基座模型MiMo-V2-Flash。该模型虽在参数规模上不占优势,却在全球开源模型代码与Agent测评基准中脱颖而出,位列前二。其核心突破在于“极致推理效率”:通过Hybrid SWA架构固定KV Cache以增强长文推理能力,并借助3层MTP推理加速并行Token验证,使推理速度提升2至2.6倍,实现了“低成本+高速度”的双重优势。现场演示中,该模型展示了编写简易操作系统、模拟太阳系运行轨迹等能力,初步展现了“模拟世界”的潜力。

罗福莉对AI“护城河”的定义引发了广泛关注。她认为,算力和数据并非决定性因素,真正重要的是科学的研究文化与方法,以及将未知问题转化为可用产品的能力。她直言,当前部分AI模型仍停留在“语言模拟器”阶段,缺乏与物理世界的深度交互,这可能导致“空中楼阁”式的风险。她强调,AI进化的下一个关键节点,在于构建能够与物理世界互动的模型。这一观点与OpenAI联合创始人Ilya的“语言可实现终极AGI”观点形成鲜明对比,凸显了小米“务实主义”的技术路线——通过多模态感知(Omni感知)将大模型嵌入智能终端,融入工作流,从而理解物理规律与世界逻辑。她还透露,小米大模型Core团队由研究、产品与工程人员深度耦合组成,虽规模不大但充满创业精神,这与她强调的“技术转化能力”高度契合。

小米集团合伙人、总裁卢伟冰在大会上披露的业务数据,为罗福莉的AI蓝图提供了坚实的支撑。2025年前三季度,小米收入突破3400亿元,同比增长32.5%,经调整利润增长73.5%;1至10月在中国手机市场销量稳居第二。核心业务的稳健增长,为技术研发提供了“压舱石”。更引人注目的是,小米未来五年计划投入超2000亿元用于研发,2026年单年投入预计达400亿元左右,重点聚焦芯片、OS、AI三大核心技术。这些技术正是小米“人车家全生态”的底层支柱。卢伟冰详细拆解了该生态的构成:产品端涵盖个人设备(手机、PC等)、出行设备(汽车)、家庭设备(IoT);技术端以芯片、OS、AI为核心驱动力;制造端依托手机、汽车、大家电工厂实现落地。这种“全链路覆盖”的生态,为MiMo大模型提供了丰富的应用场景——从手机端侧推理到汽车智能交互,再到家庭IoT设备联动,大模型得以在真实场景中不断迭代优化。

演讲尾声,罗福莉宣布了一项重大决策:MiMo-V2-Flash将全面开源,包括模型权重、技术报告,并提供限时免费的API服务。这一举措源于她对“开源价值”的深刻理解。她认为,开源本质上是一种分布式的技术加速机制。她回忆道,早期开源模型与顶尖模型存在三年代差,如今差距已缩短至数月,这充分证明了开源对技术普惠的推动作用。在她看来,开源是实现AGI普惠化的唯一路径,能够避免技术被少数主体垄断,促进全球开发者协作,共同补全AI的“演化拼图”。这一决策不仅展现了小米的技术自信,也可能重塑行业格局——中小开发者无需再为基础模型研发投入巨额成本,可基于MiMo-V2-Flash聚焦场景化创新,与小米“人车家生态”的开放合作理念形成闭环。

从罗福莉11月12日官宣加入小米,到12月16日MiMo-V2-Flash发布,再到17日首次公开演讲,短短一个月内,小米大模型团队的快速落地,印证了其“研究-产品-工程”耦合的团队优势。随着2000亿研发投入的逐步实施,以及人车家生态的持续深化,小米的AI路径或许将成为观察“技术如何从理论走向现实”的典型案例。毕竟,在AI的“进化重演”中,唯有扎根场景、开放协作,才能避免“空中楼阁”,真正走向理解世界的智能。

 
 
更多>同类内容
全站最新
热门内容