在人工智能技术迅猛发展的当下,具身智能成为行业关注的焦点。随着世界模型概念引发新一轮技术热潮,适配具身智能的大模型研发路径成为关键议题。强化学习与模仿学习之争、端到端架构与模块化设计的选择、仿真训练与真机实践的侧重,各类技术路线在行业中持续引发讨论。原力灵机联合创始人周而进在近期访谈中提出,行业需回归技术本质,其团队通过构建原生机器人模型DM0,探索出一条差异化发展路径。
周而进将具身智能的核心目标定义为构建分层智能系统。该系统由三层架构组成:顶层规划系统负责任务分解与全局决策,中层指令系统生成基础动作指令,底层执行系统则通过传感器融合与电机控制实现精准操作。这种设计源于团队对通用场景的深度思考——未来机器人需具备处理复杂动态环境的能力,如自主完成更换垃圾桶、擦拭桌面、补充饮水等多样化任务。为实现这一目标,模型必须突破单一场景限制,在硬件适配、传感器融合、任务拆解等维度实现全面泛化。
在硬件通用性方面,原力灵机提出"可组装式机器人"理念。针对物流行业不同场景需求,团队研发的模型需兼容多种机械臂构型:重载场景配置粗壮型机械臂,精细操作场景则采用桌面双臂灵巧手。这种设计要求模型具备跨硬件平台的学习能力,即使更换传感器或执行机构,仍能保持核心功能稳定。周而进强调,真正的通用模型应像人类神经系统般灵活,当某条手臂缺失或新增触觉模块时,系统能自动调整控制策略而不影响整体性能。
数据策略成为突破泛化瓶颈的关键。团队采用"仿真+真机"的混合训练模式:在室内导航、刚性物体抓取等基础任务中充分利用仿真数据,而在叠衣服、液体搬运等精细操作领域坚持真机采集。通过部署多维度传感器阵列,模型可同步获取视觉、触觉、力控等数据流。周而进特别指出,当前行业存在过度依赖视觉数据的倾向,而真实场景中触觉反馈往往决定操作成败。团队正在开发支持嗅觉传感的数据采集系统,未来计划将气味识别纳入环境感知维度。
针对模型参数量争议,原力灵机发布的DM0模型以2.4亿参数规模引发关注。周而进解释,参数规模与实际能力不存在必然关联,团队通过优化训练机制使模型在真实场景中达到60毫秒级响应速度。这种"小而精"的设计理念源于对具身智能本质的理解:与语言模型不同,机器人模型需要持续与物理世界交互,参数膨胀反而可能降低实时性。DM0的开源策略旨在推动行业建立原生模型开发标准,避免陷入对通用大模型的简单改造。
商业化路径选择体现团队务实态度。尽管终极目标是全场景通用机器人,原力灵机仍优先切入工业物流领域。周而进认为,该场景同时具备标准化流程与动态变化要素,是验证模型泛化能力的理想试验场。在皮带分拣、多品类打包等任务中,团队开发了"渐进式兜底"方案:初期通过人工辅助与远程操控确保系统稳定性,随着模型能力提升逐步减少人工干预。这种滚动开发模式使客户能早期见证技术价值,同时为模型迭代提供真实场景数据。
面对硬件性能是否制约发展的质疑,周而进指出当前瓶颈主要在于模型架构而非硬件指标。他以春晚机器人表演为例说明:当算法能实现复杂动作编排时,硬件的扭矩、精度等参数已满足基本需求。团队更关注散热、功耗等工程化问题,这些要素直接影响机器人持续作业能力。在训练机制创新方面,原力灵机正探索将世界模型与VLA架构深度融合,使模型既能预测动作后果,又能规划干预策略,这种双向建模方式被视为突破闭环控制难题的关键。










