科技·商业·财经

机器科学深圳发布Visics大模型 具身智能“登月级”家具拼装挑战成功

   时间:2026-06-25 15:44 作者:格隆汇

通用具身智能企业RoboScience机器科学在深圳召开产品发布会,正式推出自主研发的通用具身大模型Visics,并首次系统阐释其底层技术架构VLOA(Vision-Language-Object-Action)。该架构在传统视觉-语言-动作模型基础上新增对物体属性的深度解析,使机器人具备模拟人类物理直觉的认知能力,从而更高效地应对复杂现实场景中的操作挑战。

据创始人兼CEO田野介绍,当前机器人技术发展面临三大瓶颈:跨场景操作泛化能力不足、精密动作执行困难、长周期任务累积误差难以控制。Visics大模型通过VLOA架构创新,将物体三维点云轨迹作为认知与执行系统的衔接接口,成功实现两大核心模块的解耦。其中上层具身世界模型负责物理轨迹的模拟推演,下层通用操作模型完成轨迹到设备控制信号的转换,两个模块通过持续更新的点云数据保持动态协同。

在数据构建层面,公司采用仿真引擎与现实视频数据协同训练的"双飞轮"模式。联合创始人汪涛透露,自主研发的高精度仿真平台RoboMirage结合全自动视频处理管线,使单条训练数据成本压缩至行业平均水平的1/20至1/200。目前具身世界模型已积累数百万小时物体操作视频数据,通用操作模型的训练轨迹量达数百亿次,计划2026年突破万亿次里程碑。

发布会现场演示环节,搭载Visics系统的机器人完整呈现了家具自主组装的全流程。从说明书识别、部件抓取到毫米级插接,系统连续攻克双臂协同、动态力控等技术难关。特别值得注意的是,当已组装部件被人为拆解后,机器人能自动检测状态变化并续接未完成工序。团队还展示了跨形态机械手抓取、传送带动态捕捉等复杂场景的应用能力。

技术团队方面,首席科学家邵林带领的研发组连续两年斩获机器人领域顶级会议ICRA最佳论文奖项,其提出的T(R,O)Grasp算法实现每秒5帧的实时交互,抓取成功率达94.83%。CEO田野此前担任苹果人工智能平台技术负责人,在机器视觉与智能系统领域拥有丰富经验。

资本运作层面,该公司已完成多轮融资,获得京东集团、商汤科技等产业资本及达晨财智、招商局创投等财务投资机构的联合注资。目前在北京、深圳、苏州、杭州四地设立研发中心,形成覆盖算法开发、硬件测试到规模生产的完整链条。

关于商业化路径,公司制定三阶段推进策略:初期聚焦物体认知维度突破,在商超、电商物流等高频场景完成概念验证;中期拓展任务规划与硬件适配能力,推动自研控制器量产;长期目标实现B端工业场景与C端消费市场的规模化部署。汪涛特别强调,公司将保持技术中立性,提供包括软件授权、控制器解决方案在内的多元化交付模式。

 
 
更多>同类内容
全站最新
热门内容