GPT‑5.4 favicon

GPT‑5.4

OpenAI 推出 GPT-5.4:专为专业办公设计的更高效推理与计算机控制模型

介绍:

GPT-5.4 是 OpenAI 推出的最新旗舰级模型,融合了 GPT-5.3-Codex 的顶尖代码能力与增强的推理、代理工作流。它在 Excel 处理、演示文稿制作及法律文件分析方面表现卓越,并首次原生支持计算机控制功能(Computer-use),能够像人类一样操作网页和软件。GPT-5.4 提供了 Thinking 和 Pro 版本,显著提升了事实准确性并降低了 token 使用成本,是开发者和企业实现复杂任务自动化的终极工具。

记录:

2026-03-08

每月访客数:

210067.3K

GPT‑5.4 - AI Tool Screenshot and Interface Preview

GPT‑5.4 产品信息

探索未来办公:OpenAI 正式发布 GPT-5.4 旗舰模型

2026 年 3 月 5 日,OpenAI 正式推出了其最强大、最高效的专业级模型 —— GPT-5.4。作为人工智能领域的又一里程碑,GPT-5.4 不仅集成在 ChatGPT(以 GPT-5.4 Thinking 模式呈现)中,还同步登陆了 API 和 Codex 平台。该模型旨在通过卓越的推理、编程及代理(Agentic)工作流,帮助专业人士高效解决复杂的实际工作挑战。

什么是 GPT-5.4 (What's GPT-5.4)

GPT-5.4 是 OpenAI 开发的一款全方位领先的边际模型,专门为专业办公场景优化。它融合了 GPT-5.3-Codex 行业领先的代码编写能力,并显著提升了在电子表格、演示文稿及文档处理等任务中的表现。GPT-5.4 的核心优势在于其“更少沟通,更多产出”的能力,能够准确、快速地执行复杂任务。此外,OpenAI 还推出了 GPT-5.4 Pro 版本,专门为需要极致性能处理复杂任务的用户设计。

GPT-5.4 核心功能与特性 (Features)

1. 卓越的推理与专业知识

GPT-5.4 在 GDPval 测试(涵盖 44 种职业的专业任务)中达到了 83.0% 的胜率,匹配或超越了行业专业人士的水平。相比前代 GPT-5.2,它在投资银行分析、财务建模及法律合同处理方面表现出更强的逻辑性与精确度。

2. 原生计算机控制能力 (Computer Use)

作为首个具备原生、最先进计算机使用能力的通用模型,GPT-5.4 允许 AI 代理像人类一样通过屏幕截图、键盘和鼠标指令在不同软件间切换。它在 OSWorld-Verified 测试中取得了 75.0% 的成功率,甚至超过了 72.4% 的人类平均表现。

3. 工具搜索与代理效率 (Tool Search)

为了应对海量的外部工具调用,GPT-5.4 引入了工具搜索 (Tool Search) 功能。模型不再需要预载所有工具定义,而是根据需求搜索并调用相关工具。这一改进使 token 使用量降低了 47%,显著减少了延迟并节省了成本。

4. 强大的视觉感知与文档解析

GPT-5.4 支持全新的“原始图像输入细节”(Original image input detail),可处理高达 1024 万像素或 6000 像素边长的图像。在 OmniDocBench 文档解析测试中,其错误率显著低于 GPT-5.2,能够更精准地识别高精度图表和密集文本。

5. 更低的幻觉率与更高事实性

GPT-5.4 是迄今为止最真实可靠的模型。在事实错误核查中,其单个声明出错的概率比 GPT-5.2 降低了 33%,整体响应的错误率降低了 18%。

GPT-5.4 应用场景 (Use Case)

  • 金融与法律分析GPT-5.4 擅长创建复杂的 Excel 财务模型、分析长篇法律合同,并在 BigLaw Bench 评估中获得了 91% 的高分。
  • 自动化软件开发:借助 Codex 平台和新的“Playwright (Interactive)”技能,GPT-5.4 可以一边编写代码一边自动测试和调试网页应用,大幅缩短开发周期。
  • 企业办公自动化:配合 ChatGPT for Excel 插件,用户可以利用 GPT-5.4 自动处理大批量数据录入、生成高审美水准的 PPT 演示文稿。
  • 深度网络调研GPT-5.4 Thinking 能够持续进行多轮网络搜索,精准定位“大海捞针”式的特定信息,并合成逻辑严密的答案。

如何使用 GPT-5.4 (How to Use)

  • ChatGPT 用户:Plus、Team 和 Pro 用户现在可以从模型切换器中选择 GPT-5.4 Thinking。Enterprise 企业版用户可由管理员开启。用户可以在模型思考过程中实时调整方向或添加指令。
  • 开发者与企业用户:通过 API 调用 gpt-5.4gpt-5.4-pro。对于代码密集型任务,建议在 Codex 中使用 /fast 模式,可获得 1.5 倍的 token 产出速度。
  • Excel 插件:直接下载最新发布的 ChatGPT for Excel 插件,即可在表格中原生体验 GPT-5.4 的数据建模能力。

常见问题 (FAQ)

Q: GPT-5.4 的价格如何? A: 在 API 中,GPT-5.4 的每 token 价格略高于 GPT-5.2(输入 $2.50/M,输出 $15/M),但由于其 token 效率极高(解决同样问题消耗更少 token),实际总成本往往更低。

Q: GPT-5.4 与 GPT-5.3-Codex 的关系是什么? A: GPT-5.4 是首个将 GPT-5.3-Codex 的尖端编程能力集成到主线推理模型中的版本。它统一了代码与通用推理的优势,简化了用户的选择。

Q: GPT-5.4 支持多大的上下文窗口? A: GPT-5.4Codex 中实验性支持高达 1M(100 万)个 token 的上下文窗口,非常适合处理跨文件的超长作业流。

Q: 之前的模型还会保留吗? A: GPT-5.2 Thinking 将作为“Legacy Models”在 ChatGPT 中保留至 2026 年 6 月 5 日,随后将被完全替代。

"GPT-5.4 是我们尝试过的最佳模型。它在处理长周期交付物(如演示文稿、财务模型和法律分析)方面表现卓越,速度更快且成本效益更高。" —— Brendan Foody, Mercor CEO

Loading related products...