近日,有消息人士向媒体透露,原阿里巴巴通义实验室Qwen(千问)大模型后训练团队负责人郁博文,已正式入职字节跳动,出任Seed团队视觉模型与多模态交互方向的后训练负责人。这一变动引发了行业对大模型领域技术人才流动的关注。
据知情人士介绍,郁博文的离职与阿里通义实验室内部组织架构调整密切相关。2026年3月,该实验室启动了新一轮改革,将原本垂直整合的Qwen团队拆分为预训练、后训练、文本处理、多模态交互等多个独立模块。这一调整使得后训练团队的管理权限被大幅压缩,与郁博文长期坚持的"预训练与后训练必须深度耦合"的技术理念形成直接冲突。技术路线分歧成为其离职的重要诱因。
商业压力的加剧进一步推动了这一人事变动。消息显示,阿里高层对千问团队设定了严格的商业化考核指标,要求团队在短期内实现技术成果的商业转化。这种转变导致团队内部出现显著分歧,部分技术人员认为过度强调商业化可能影响模型研发的长期价值。在多重因素作用下,郁博文于2026年3月3日提交辞职申请,并于次日完成离职手续。
公开履历显示,郁博文是2022届博士毕业生,通过阿里集团最高级别校招项目"阿里星"加入达摩院,入职即担任算法专家(P7)。在通义千问大模型的早期研发阶段,他深度参与模型训练工作,凭借技术能力迅速成长为团队核心成员,最终负责后训练环节的全面工作。其接任者为前Google DeepMind高级资深研究员周浩,这位具有国际顶尖实验室背景的技术专家,目前正带领团队推进千问模型的后续研发。
行业观察人士指出,大模型领域的技术路线之争与商业化压力,正在重塑头部科技企业的人才布局。郁博文从阿里到字节跳动的职业轨迹,折射出国内AI企业在模型架构设计、技术理念落地等方面的深层差异。随着多模态大模型竞争进入白热化阶段,这类核心技术人员流动或将引发新的技术路线调整。










