科技·商业·财经

灵初智能CEO王启斌:专注数据基建,为通用具身智能铺就低成本之路

   时间:2026-03-12 21:39 作者:李娜

近日,具身智能领域迎来一笔重磅融资——灵初智能宣布完成天使轮及Pre-A轮共计20亿元融资,投资方阵容堪称豪华,既有国开金融、国中资本、央视融媒体产业投资基金等国家级“国家队”资本,也有上海国资徐汇资本、梁溪科创产业二期母基金(博华资本管理)、锡创投等地方国资,还有众多知名产业资本和市场化基金参与其中,多家老股东更是实现超额跟投,华兴资本担任长期财务顾问。本轮融资资金将主要用于加速灵初智能在物流场景的规模化落地以及数据采集体系建设。

灵初智能由前云迹科技、京东算法团队核心成员创立,自成立之初便不走寻常路。在行业普遍聚焦核心零部件、移动底盘甚至急于打造完整双足人形机器人时,灵初智能却将目光瞄准了“操作”,尤其是通用灵巧操作。公司创始人王启斌指出,从2015年前后配送机器人兴起,行业就始终未能攻克“手”上的操作难题。

在王启斌看来,具身智能正处于“冷启动”关键阶段,而高质量、低成本的人类操作数据是破局关键。他以特斯拉的FSD(全自动驾驶)模式为例,特斯拉因Model 3在2017年发售后迅速实现百万台年销量,底层数据回流让FSD快速迭代。但具身智能面临的数据难题更为棘手,缺乏数据导致模型无法泛化,机器人无法大规模部署,进而无法获取低成本真实世界数据,而仿真数据又存在较大差距,无法直接用于训练泛化模型。基于此,灵初智能将第一个战场选在了数据基建,而非双足运动或关节模组性能竞赛。

在数据采集方面,灵初智能有着独特思路。去年,UC Berkeley提出的UMI(Universal Manipulation Interface)范式引发全球关注,其核心是用低成本的人持夹爪采集数据,但这种方式采集的数据并非人类数据,无法泛化到五指灵巧手上。灵初智能则回归“人本”,推出“灵初数据采集引擎”。这并非简单的数据手套,而是一个集成视觉(多视角)、触觉(压阻/电容)、21个关节角信息的复杂系统。该方案先学习人类操作底层逻辑,再通过“重定向”技术将人类操作意图映射到不同结构、自由度的机器人本体上,使模型能适应多种硬件形态,不被特定机械构型锁定。

这一方案的成本优势十分明显。据透露,其数据采集设备的硬件投入成本仅为真机遥操作方案的十分之一。今年3月后,还将推出便携式版本,进一步降低数据采集成本,未来甚至计划通过“众包”模式,让普通人在工作和生活中佩戴手套采集数据,实现去中心化数据回流。王启斌强调,成本只是保证数据大规模扩展,把高信噪比数据训进模型才是灵初的核心竞争力。

在商业化落地场景选择上,灵初智能聚焦物流场景,且切口极为具体,如衣服供包、入箱拣选、分拨墙等。王启斌认为,物流场景远比简单的“抓取 - 放置”(Pick and Place)复杂。以商超补货为例,要把一箱东西拆开,拿出物品放到容器里,推到货架,放上去并理货,往挂钩上挂东西、开冰箱门补饮品、拿出过期物品等,是十几个动作的序列。实际场景中,物品形态千差万别,对机器人的感知、规划和操作精度要求极高,涉及视觉识别、柔性抓取、轨迹规划、力控等综合性挑战。目前,灵初智能在衣服供包场景的节拍已达到800 UPH(Units Per Hour),达到国内最高水平,并已进入客户现场陪产阶段。

面对外界对“模型碎片化”和“场景泛化边界”的担忧,灵初智能技术负责人Viktor详细拆解了公司的完整技术管线。他将技术管线类比为大语言模型训练过程:首先是预训练,利用数据手套大规模采集长程、多任务的人类操作数据,培养“知识面广但不够精专”的“中学生”;接着是后训练,在选定落地的真机上进行少量(约100小时级)遥操作数据采集,让模型适配特定机型“身体”结构;然后是真机强化,通过强化学习提升任务成功率和节拍;最后是端侧推理与纠错,在真实部署中遇到无法自动恢复的极端情况,由人工介入纠错,数据回流到模型迭代。预训练数据决定泛化能力广度,后训练与强化数据决定具体场景性能高度,这种分层数据体系与模型迭代路径确保公司既不失通用性,又能落地。

对于具身智能整体发展阶段,灵初智能认为这是一个长达十年的长周期赛道,目前处于Gartner曲线早期。硬件百花齐放的第一波浪潮已过,当前正迎来数据浪潮。灵初智能目标明确,到2026年将真实世界人类操作数据规模提升至百万小时级别,并基于此训练出高度泛化的预训练模型。同时,公司将围绕数据采集设备销售、数据资产变现以及场景解决方案交付,建立多元化商业模式。在行业聚焦人形机器人外在形态与双足运动时,灵初智能回归数据源头,致力于降低“教机器人操作”成本,或许在通往通用具身智能的路上,这将成为其制胜关键。

 
 
更多>同类内容
全站最新
热门内容