科技·商业·财经

AI新赛道崛起!李飞飞Jeff Dean押注持续学习,让模型在真实场景中越用越聪明

   时间:2026-06-01 23:23 作者:朱天宇

在人工智能领域,一场关于模型进化路径的变革正在悄然发生。当行业普遍聚焦于预训练模型规模扩张时,一家名为Trajectory的初创公司另辟蹊径,将目光投向模型在真实场景中的持续进化能力。这家由前Google DeepMind、Apple AI核心成员创立的企业,近日完成1500万美元种子轮融资,投后估值达1.15亿美元,投资方阵容包括Conviction、Bessemer Venture Partners等知名机构,更引人注目的是Google DeepMind首席科学家Jeff Dean与"AI教母"李飞飞的个人投资。

Trajectory的核心技术突破在于构建"反馈闭环"系统。与传统模型训练不同,该公司通过捕捉用户与AI交互过程中的实时数据——包括接受建议、修改内容、撤回操作等行为信号,将其转化为训练样本反哺模型优化。这种机制使得模型能够突破静态限制,实现每周一次的迭代更新。创始人Ronak Malde指出:"当前最强AI仍是静态系统,用户今天遇到的错误,明天依然存在。我们通过持续学习打破这个循环。"

技术实现层面,Trajectory开发了标准化数据格式"Trajectory",将智能体行为轨迹与产品遥测数据转化为四层结构:完整对话(Trajectory)→交互轮次(Step)→用户-AI回合(Turn)→单条消息(Message)。这种设计使每个交互步骤都成为自包含的训练样本,支持从LangSmith等观测平台直接接入企业数据。为解决合规难题,系统采用SOC 2认证架构,赋予客户完全的数据控制权,所有模型更新均需通过客户评估审批。

在法律科技领域,Harvey公司联创Gabe Pereyra的评价印证了这项技术的价值:"法律专业知识存在于不断演变的判例体系中,通用大模型无法捕捉这种动态变化。持续学习机制为专业领域AI提供了关键基础设施。"目前,Trajectory已与Clay、Harvey等AI原生企业达成合作,其客户案例显示,模型能够从自身错误中学习并改进表现。

这家初创公司的技术路线与学术界前沿思考形成共振。2025年NeurIPS大会上,强化学习奠基人Rich Sutton在特邀演讲中强调:"真正的智能源于持续经验积累,AI产业需要回归智能体与环境交互的本质。"他提出的Oak架构愿景,与Trajectory的实践方向不谋而合。作为RLHF(基于人类反馈的强化学习)技术的重要推动者,Sutton的论断为持续学习路线提供了理论支撑。

当前,Trajectory已构建起包含11名顶尖研究员的团队,成员来自OpenAI、meta超级智能实验室等机构。尽管其模型更新周期仍为每周一次,尚未达到理论上的实时学习,但标准化训练管线的建立标志着重要突破。联合创始人Michael Elabd透露,团队正在探索将更新周期压缩至每日甚至每小时,最终实现"每个员工拥有专属AI"的愿景。

这场变革揭示出AI基础设施的新竞争维度。当开源模型生态日益成熟,企业竞争焦点正从模型本身转向使模型持续进化的工程能力。数据治理、评估管线、安全合规等传统被忽视的环节,正在成为新的技术护城河。Trajectory的实践表明,在API调用模式之外,构建自主可控的模型进化系统,可能成为企业AI落地的关键路径。

 
 
更多>同类内容
全站最新
热门内容