滚动资讯

当前位置：网界 > 行业动态 > 正文内容

周浩携DeepMind经验加盟千问，能否引领AI模型迈向“会办事”新阶段？

时间：2026-03-07 02:08 作者：赵云飞

近日，AI领域迎来一则重磅消息：林俊旸深夜发文“告别”千问，这一动态在AI圈掀起轩然大波，也让此前低调的周浩进入公众视野。2026年1月，周浩低调加入阿里巴巴，起初挂靠在夸克部门短暂过渡，随后便迅速转入通义实验室，接替同日离职的后训练负责人郁博文，直接向阿里云CTO、通义实验室负责人周靖人汇报工作。

周浩有着耀眼的学术背景和丰富的行业经验。他本科毕业于中国科学技术大学，2019年在威斯康星大学麦迪逊分校取得机器学习与计算机视觉方向的博士学位。之后，他在meta从事AI基础研究，积累了大规模模型训练的工程经验。不过，真正让他声名远扬的是在DeepMind的工作经历。在那里，他一路晋升至高级主任研究科学家，这是谷歌研究体系中极少数人能达到的级别，同时他还担任Gemini强化学习与自我改进团队的负责人，参与了从Gemini 1.5到Gemini 3 Pro等谷歌旗舰大模型核心功能的研发工作。

周浩在DeepMind的诸多成果，彰显了他卓越的技术实力。2023年，在Gemini 1.0的技术报告中，他担任“Gemini App Factuality Co-Lead”，主要负责保障Gemini面向C端用户输出的事实准确性。传统做法是事后检测，成本高、延迟大且难以覆盖所有场景。而周浩和团队从模型训练和强化学习的源头入手，通过设计专门的奖励函数和训练策略，让模型在生成每个token时就内化“事实准确性”约束，学会区分已知事实和不确定推测，不确定时主动降低置信度甚至拒绝回答。这一事实性保障体系成效显著，Gemini Ultra在MMLU基准测试中取得90.04%的准确率，超越人类专家水平，且在事实性相关任务上表现强劲。

2024年，周浩作为核心贡献者参与的VideoPrism项目，解决了AI“看懂视频”的难题。以往AI看视频是将视频拆成一帧帧图片分析，只能认出画面内容，却不懂前后发生什么。VideoPrism构建的视频基础编码器，能处理各类视频内容，通过将大规模视频 - 文本对数据与纯视频数据结合，采用两阶段训练，让模型同时学会语义理解和视觉细节。在33个视频理解基准测试中，VideoPrism在31个上达到最优性能，且用的是同一个冻结模型，几乎无需针对不同任务适配，该成果成为Gemini视频理解能力的技术基石之一。

周浩还是Gemini 3.0的关键贡献者，负责多步骤强化学习，让模型具备多轮思考、规划、执行、反思的链式推理能力。这使得Gemini的DeepThink和DeepResearch等功能得以实现，普通AI回答问题“想一步、说一步”，而Gemini能拆解问题、制定计划、逐步执行并检查反思，DeepResearch功能可自动搜索多个网页并综合结果写出有逻辑的研究报告。

周浩的研究路线清晰，从让AI明白错误，到认识时间序列，再到学会规划和反思，随着时间推移，AI能理解的事物愈发复杂，也更能满足真实用户需求，而这一发展轨迹与千问接下来的发展方向高度契合。

2026年2月，千问系列发布最新旗舰版本Qwen 3.5，采用混合架构，结合Gated DeltaNet和稀疏混合专家技术，旗舰模型Qwen3.5 - 397B - A17B总参数量3970亿，每次推理仅激活170亿参数，在保持高性能的同时，成本降低60%，吞吐量提升8倍。然而，Qwen 3.5虽在架构和预训练上达到世界级水准，但后训练阶段存在不足，尤其在让模型学会推理、反思、自我纠错方面是短板。在多个体现深度推理和复杂任务能力的测试中，Qwen 3.5 - 397B落后于同期发布的Gemini 3.1 Pro。

不过，Qwen 3.5具备agent基础能力。2026年1月，千问App全面接入淘宝、支付宝、高德地图、飞猪等，实现“一句话点外卖、订机票、叫出租”，但这些功能较初级，多是串联API调用，缺乏真正的多步骤推理。例如航班取消时，AI难以自主发现问题并切换方案；用户让安排行程，AI也难以拆解成多个子任务并执行。在林俊旸主导下，Qwen 3.5实现原生多模态，能处理高分辨率图片和视频片段，其架构与周浩在VideoPrism上的方法高度一致，周浩有望助力千问在视频时序推理、动作理解等维度取得突破。

在组织架构方面，此前林俊旸主导时，千问团队核心竞争力在于独特组织方式，预训练、后训练、多模态、基础设施在一个团队内部闭环，沟通链路短，技术判断可当天落地实验。但随着团队规模扩大到几百人，这种“一个人的大脑”式管理出现瓶颈，阿里进行架构调整，将闭环团队拆分为多个平行水平分工模块，考核逻辑也从模型性能等转向对集团业务的提效成果、千问App用户增长、商业化ROI。周浩此时接手千问，面临技术有短板、组织模式转变、战略方向调整等诸多挑战。

当前，千问正处于战略大调整时期，底层模型性能至关重要。2025年11月，阿里将“通义”App更名为“千问”，吴泳铭明确表示要打造AI原生的C端超级入口。3月2日，千问AI眼镜在MWC巴塞罗那全球首秀并开启预约，年内还将发布AI指环、AI耳机等产品面向全球发售。千问App将从“对话框产品”转变为“任务完成产品”，借助周浩的多步骤强化学习，把“办事”能力做成独立模块，主动识别用户复合任务并完成，成为“AI秘书”。而且，千问眼镜若能落地VideoPrism的视频时序理解能力，将具备情境感知能力，无需用户开口询问，就能理解用户行为并预判需求，这将是相对于手机语音助手的差异化价值。林俊旸让千问成为受全球开发者尊敬的技术品牌，周浩则需让千问不仅聪明，还要稳定、准确、能把事办完。

更多>同类内容

海信智慧风E5系列：精准回应年轻需求，重塑AI空调新体验

03-07

沐曦股份入股物理AI基础设施供应商飞捷科思

03-07

小米入股银河互联网电视公司

03-07

天赐材料在九江成立特种材料科技公司

03-07

天亿马等在上海成立人工智能科技公司，含机器人业务

03-07

松延动力新专利可使仿生机器人表情更逼真

03-07

深圳引导基金、建信投资等新设私募股权投资基金，出资额70亿

03-07

宁德时代在苏州成立时代新能科技公司，注册资本20亿

03-07

兆易创新入股存算一体AI芯片企业微纳核芯

03-07

抖音在福建成立矢量引擎科技公司

03-07

积成电子在山东成立科技公司，注册资本4000万

03-07

科陆电子等成立智慧能源发展公司

03-07

中国石化等成立绿能综合能源公司，含站用加氢业务

03-07

大疆新专利可减少飞行器与障碍物碰撞的概率

03-07

银河通用机器人在厦门成立新公司，含多项机器人业务

03-07

点击查看更多 +

全站最新

全国人大代表刘庆峰展望：未来五年科大讯飞行业模型将比肩人类专家

领克900全尺寸大五座SUV官宣登场，全新日冕金车色引领新潮流

智能门锁行业：群雄逐鹿，AI与生态融合引领未来新方向

Anthropic再传喜讯：Claude日新增用户超百万收入增长但成本高企

AI竞赛转向：OpenClaw引领技术落地，大厂筑基小团队深耕场景成趋势

2026年5款免费36氪文章总结工具实测：听脑AI凭高效精准登顶榜首

热门内容

本栏最新

网界 - 新财经新科技新未来 - 网界传媒旗下网站 - 中国 · 北京
合作咨询微信：netspread（注明:网界）
网界^®是本公司38类注册商标，是该商标的唯一持有者，未经授本公司授权，严禁使用。
Copyright © CNU 2012-2022 www.cnu.com.cn All rights reserved. 鲁ICP备2022032383号-6 鲁公网安备37010202700502号