科技·商业·财经

OpenAI发布GPT-5.4系列模型:推理编码能力升级,支持百万tokens上下文

   时间:2026-03-06 13:10 作者:顾雨柔

OpenAI 今日宣布推出全新一代 GPT-5.4 系列模型,包含面向对话场景的 GPT-5.4 Thinking 版本与专注复杂任务处理的 GPT-5.4 Pro 版本。此次升级首次将深度推理、代码生成与智能体操作能力集成于单一架构,标志着专业领域人工智能应用进入新阶段。

在交互体验方面,GPT-5.4 Thinking 引入"思维可视化"功能,当用户提出复杂问题时,模型会主动展示推理路径的中间步骤。这种透明化设计允许用户在响应过程中随时修正方向,例如调整数据分析维度或修改代码逻辑,显著减少传统对话中的反复确认环节。测试数据显示,该功能使专业用户获取精准结果的效率提升40%以上。

针对长文本处理场景,新模型通过改进的注意力机制实现了百万级上下文窗口支持。在学术研究场景中,系统能够持续追踪超过200页论文的核心论点,在法律文书分析时保持跨章节的逻辑关联性。特别在需要多轮推导的数学证明或编程调试任务中,模型展现出更强的步骤记忆能力,确保最终结论与初始条件严格对应。

技术突破性体现在原生计算机操作能力上。GPT-5.4 Pro 版本通过集成视觉识别与动作控制模块,可直接处理屏幕截图并执行键盘鼠标指令。在演示案例中,该模型成功完成跨软件的数据迁移任务:从电子邮件提取订单信息,自动填充至ERP系统,最后生成可视化报表并发送给指定联系人。整个流程无需人工干预,耗时较传统方法缩短75%。

开发者接口层面,新模型提供更精细的参数控制选项。专业用户可调节推理深度、结果确定性等维度,例如在医疗诊断场景中要求模型提供多种可能性分析,或在金融建模时强制遵循特定假设条件。这种灵活性使AI工具能够更好适配不同行业的合规要求与专业规范。

据OpenAI技术文档披露,GPT-5.4系列采用混合专家架构(MoE),在保持4096个激活单元的同时,通过动态路由机制将计算资源集中于当前任务相关模块。这种设计使模型在处理简单查询时能耗降低60%,而在执行复杂任务时又能调用全部算力,实现效率与性能的平衡。

 
 
更多>同类内容
全站最新
热门内容