科技·商业·财经

江苏宿迁十万“机器人老师”上线,为具身智能注入千万小时真实数据动力

   时间:2026-05-22 22:40 作者:天脉网

在江苏宿迁,一场前所未有的AI行动正悄然改变着当地居民的生活。成千上万的市民在从事家务或农活的同时,佩戴着特殊的数据采集设备,记录下擦桌子、炒菜、缝纫、照顾老人等日常动作。这些看似平凡的行为,实则正在为具身智能产业破解“数据荒”这一核心难题提供关键支持。

中国机器人产业在硬件技术领域已取得显著突破。四足机器人能够攀爬山地,人形机器人甚至可以完成马拉松赛事。中商产业研究院数据显示,2025年中国具身智能市场规模预计达到9150亿元,2026年更将突破10900亿元。然而,在硬件快速发展的背后,机器人“大脑”的缺失成为制约行业发展的关键瓶颈。当前机器人虽能完成表演性动作,却难以应对拧瓶盖、磕鸡蛋等基础操作,更无法适应家庭和工厂的复杂环境。

数据短缺是造成这一困境的根本原因。训练具备泛化能力的具身大模型需要数千万甚至上亿小时的训练数据,而全行业现有数据集总量仅几十万小时,存在两个数量级的差距。更关键的是,普通视频记录的“发生了什么”对机器人训练价值有限,机器人需要的是“如何发生”的细节信息,包括手部位置、物体空间关系、动作意图等,这些都需要专业处理才能转化为有效数据。

第一视角人类操作数据正成为全球科技巨头争夺的焦点。英伟达、特斯拉等企业通过大规模采集人类操作视频,推动机器人模仿学习发展。这类数据不仅能记录动作结果,更能保留视线移动、手眼协调、空间感知等隐性信息,这些正是机器人形成泛化能力的核心要素。英伟达提出的EgoScale框架明确将此类数据视为训练基础设施,研究发现数据规模扩大可显著提升模型任务成功率。

京东凭借独特的产业优势,在这场数据竞赛中占据先机。公司启动的具身数据采集行动计划动员超60万人参与,其中宿迁就有10万人,目标两年内完成1000万小时真实场景视频数据采集。京东的竞争优势在于其覆盖零售、物流、健康、家政、工业等领域的全场景布局,拥有3600多个智能仓库、全国配送网络、超万家线下门店和20余万家合作药房,这些真实产业场景为数据采集提供了得天独厚的条件。

在技术实现层面,京东构建了完整的全链路数据基础设施。采集端使用车规级传感器和4K镜头设备,确保高速运动场景下的稳定记录;处理端通过任务切分、语义标注等技术,将原始视频转化为结构化数据;训练平台使模型开发效率提升3.5倍,基于该体系训练的具身大模型在测评中任务成功率达73.5%,超越行业头部水平。

宿迁成为这一战略的重要实践地。这座与京东渊源深厚的城市,不仅是刘强东的故乡,更是京东早期客服和物流中心。当数据采集需求与当地丰富的人力资源相遇,催生出新的产业合作模式。参与数据采集的市民来自果园、服装厂、康养机构等多个行业,他们的日常劳作通过专用设备被精准记录,成为训练机器人的优质“教材”。这种模式既为京东提供了高多样性数据,也为当地创造了数据采集师、标注师等新型数字职业。

京东的数据战略具有显著的开放性特征。公司推出的Real to Sim技术可将真实数据转化为仿真数据,再通过反向渲染生成训练数据,实现数据的高效扩增。已上线的具身智能数据交易平台首批开放了高质量标注数据集,覆盖300余个真实场景,帧率达60FPS。京东还邀请合作伙伴共建数据生态,旨在成为具身智能时代的基础设施提供商,连接算法企业、硬件制造商和系统集成商等产业链各环节。

在产业落地方面,京东采取多线并进策略。零售领域已与近200个品牌合作,计划2026年助力机器人品牌销售额突破百亿元;物流领域构建机器人维修生态,专业工程师团队将扩至万人;工业领域提供一站式供应链服务,实现机器人制造物料全覆盖。这些举措标志着AI技术正从数字世界向物理世界深度渗透。

当前AI发展正迎来关键转折点。过去十年,大语言模型在数字世界取得突破,但始终未能真正理解物理世界的操作逻辑。下一阶段竞争将聚焦于真实场景中的感知、决策和行动能力,这需要大规模采集人类操作经验数据。京东通过构建人、场景、数据三位一体的产业体系,正在将物理操作转化为可计算的数字资产,为机器人从“看懂”到“理解”世界提供关键支撑。

 
 
更多>同类内容
全站最新
热门内容