近日,OpenAI联合创始人兼总裁Greg Brockman在一场播客访谈中,揭开了公司战略调整背后的诸多细节,引发行业广泛关注。此次访谈不仅回应了外界对OpenAI放弃Sora项目的猜测,还透露了未来重点布局的Super App、新模型“Spud”以及AI研究员等关键信息。
针对外界对OpenAI放弃Sora项目的质疑,Greg表示,这并非从消费端转向B2B,而是基于战略聚焦的考虑。OpenAI目前同时推进两条技术路线:一是研发深度学习技术,二是部署技术以积累落地经验。当前技术已验证可行,需进入真实世界获取反馈,因此公司决定将主要精力放在GPT系列上,包括文本和语音交互等领域。Sora项目并未被完全放弃,而是转向机器人领域继续研究,但短期内难以在知识工作领域大规模落地。
当被问及为何不押注视频生成技术时,Greg指出,尽管视频生成进步显著,但机会过多时需排序和把握时机。OpenAI已确信文本模型可通往AGI,且今年将推出更强模型。例如,某物理学家借助OpenAI模型在12小时内解决了研究难题,这种“思考”能力让公司决定加倍投入文本模型路线。对于竞争对手DeepMind认为图像生成器更接近AGI的观点,Greg回应称,OpenAI从一开始就选择了相信的AGI路径,且图像生成功能已基于GPT架构实现,而非扩散模型。
关于备受瞩目的Super App,Greg透露,它将整合编程、浏览器和ChatGPT,成为用户体验AGI力量的端点应用。这款应用不仅是工具,更是“个人助理”,能理解用户目标、建立信任关系。未来,Super App将具备记忆功能,连接邮件、日历等,深入帮助用户达成目标。该应用将于未来几个月分步推进,起点是Codex应用,第一步是让Codex对普通知识工作更友好。
在竞争方面,Greg承认Anthropic的Claude Code等类似功能已出现,但OpenAI在编程方向上一直重视,且正在补上“最后一公里”的易用性。去年年中,公司组建团队聚焦真实世界问题,构建训练环境,让AI适应实际软件工程中的混乱情况。如今,OpenAI在竞争中已占据优势,用户更倾向于选择其产品。
传闻中的新模型“Spud”也在此次访谈中揭开面纱。Greg表示,“Spud”是OpenAI过去两年研究成果的体现,是一个新的预训练模型。它能解决更复杂的问题,理解力更强,对上下文把握更好,既能拉高问题解决的天花板,也能提升基础体验。不过,普通用户能否明显感觉到变化取决于应用场景,有些人会感觉天差地别,有些应用则变化不明显。但随着技术变强,用户会逐渐感知到AI“能帮上忙”。
OpenAI内部正在开发的自动化AI研究员计划秋季推出。Greg介绍,该研究员将实现研究科学家工作流程的自动化,目前已能承担相当比例的科研任务。公司会像带初级研究员一样,给它方向并审阅结果。对于AI发展可能带来的风险,Greg表示担忧,但OpenAI在技术上投入了很多保障安全的措施,如防止提示词注入攻击。同时,公司认为应构建“有韧性的开放系统”,让众多参与者共同开发AI,并围绕技术建立社会基础设施。
对于AGI的实现时间,Greg认为不同人定义不同,若以他个人标准,已完成70%到80%,未来几年内将拥有能完成电脑上几乎任何智力任务的AGI。在模型发展路径上,Greg指出,随着基础模型变强,AI从能完成20%的任务跃升到80%,带来了巨大变化。未来,公司将继续在每个维度上推进,如让AI操作电脑、建设企业级配套技术、推动语音交互等。公司还在理解模型能力阶段,将训练扩展到开放式问题领域。
针对是否需要大规模预训练的讨论,Greg认为模型生产流程的每一步都有相乘效应,更强的预训练会让后续步骤更轻松。公司要平衡预训练和推理能力,找到“智能×成本”的最优解。在算力方面,Greg表示,无论训练和推理配比如何变化,大规模训练仍需集中算力,且NVIDIA团队出色,OpenAI与其深度合作。公司今年融到的资金将投入数据中心,因为算力是收入中心,增长永远赶不上需求。对于其他玩家“过于冒进”的评论,Greg不同意,他认为OpenAI审慎且前瞻性地判断了技术走向,提前布局算力。
在公众对AI的接受度方面,Greg认为需要向大众展示AI如何改善生活,如有人用ChatGPT协助诊断出孩子被误诊的脑瘤。对于数据中心带来的环境和电费担忧,他解释称水资源消耗小,公司会支付能源费用,不推高居民电价,某些地方数据中心还帮助升级了电网,降低了居民电费。最后,Greg建议害怕AI的人亲自体验工具,理解其利弊,而最能从AI中受益的人是带着好奇心尝试并将其融入工作流程的人。







