OpenAI再度发力,正式推出其前沿模型系列中的最新力作——GPT-5.4。此次发布不仅包含标准版本,还首次引入了具备深度推理能力的GPT-5.4 Thinking版本,标志着该系列模型在性能边界上实现了又一次重大突破。这一动作被视为对去年12月紧急发布的GPT-5.2“红色代码”升级的延续,旨在应对来自谷歌Gemini等竞争对手的挑战。
据官方披露,GPT-5.4在六大核心领域实现了显著提升。首先是编码与文档理解能力,模型能够更精准地解析复杂代码结构,同时深入理解多格式文档内容。其次是工具使用与指令遵循能力,用户可通过自然语言指令直接调用模型完成特定任务。在图像识别与多模态处理方面,GPT-5.4展现出更强的跨模态理解能力,可高效处理图文混合信息。针对长时间运行任务和多步骤智能体工作流,模型优化了任务分解与执行逻辑,显著提升了复杂流程的处理效率。工具密集型任务的令牌效率得到优化,端到端性能表现更为出色,智能体网络搜索能力也进一步强化,能够快速整合多源信息完成复杂查询。
该模型最引人注目的创新在于支持高达100万令牌的上下文窗口,这一突破性设计使用户能够一次性处理整个代码库、长篇文档集合或复杂的智能体运行轨迹,彻底改变了传统模型对信息长度的限制。更值得关注的是,GPT-5.4成为首个内置“计算机使用”能力的主线模型,AI智能体可直接与软件交互,通过“构建-运行-验证-修复”的闭环自主完成任务,为自动化操作开辟了全新路径。同时,作为首个支持上下文压缩的主线模型,GPT-5.4在处理长时间智能体任务时能够精准保留关键信息,确保复杂操作流程的连贯性。
从应用场景来看,GPT-5.4在客服、数据分析、金融等需要处理大量文档和电子表格的领域表现出色。其深度推理能力可帮助用户快速定位关键信息,完成复杂的数据分析任务。在金融领域,模型能够自动解析财务报表,识别潜在风险点;在客服场景中,则可实时理解用户需求,提供精准解决方案。
根据发布计划,GPT-5.4已开始在ChatGPT和Codex平台逐步部署。其中,具备深度推理能力的GPT-5.4 Thinking版本将面向Plus、Team和Pro订阅用户开放,并计划在三个月后取代现有的GPT-5.2 Thinking版本。这一更新策略显示出OpenAI持续优化产品体验的决心,也为用户提供了更强大的AI工具选择。







