财联社 3 月 6 日讯 (编辑 牛占林)当地时间周四,OpenAI 正式推出 GPT-5.4,这是其最新一代 AI 旗舰模型。据该公司介绍,新模型在推理能力、编程能力,以及处理涉及电子表格、文档和演示文稿等专业办公任务方面均取得明显进步,并且在完成任务时需要用户反复交互的次数更少。
同时,这也是 OpenAI 首款具备原生计算机使用能力的模型,这意味着它可以代表用户操作电脑,在不同应用程序之间执行任务并完成工作流程。
这一新模型的发布,标志着 AI 企业竞相构建的"智能体未来"又向前迈进了一步。在这一愿景中,由 AI 驱动的智能体网络将在后台自主运行,完成复杂的线上及软件内任务。
此前,OpenAI 已推出 ChatGPT Agent,而去年市场上也涌现出一批类似的智能体工具,它们能够控制用户的计算机执行特定操作,例如搜索并购买烹饪食材。
目前,OpenAI 正将 GPT-5.4 向其 API 接口及 AI 编程工具 Codex 开放,同时将推理模型 GPT-5.4 Thinking 部署至 ChatGPT 平台。
据 OpenAI 介绍,GPT-5.4 不仅能够编写代码来操控计算机,还能根据屏幕截图发出键盘和鼠标指令。该模型在使用网页浏览器、调用工具及 API 以辅助任务完成方面,也展现出更高的准确性和效率。
此外,GPT-5.4 在处理需要整合多源信息的复杂查询时表现更为出色。OpenAI 表示,该模型"能够进行多轮持续搜索,精准识别最相关的信息源,尤其擅长解答'大海捞针'式的难题,并将搜索结果整合为清晰、条理分明的答案"。
OpenAI 宣称 GPT-5.4 是其"迄今为止事实性最强的模型",单个陈述的失实概率较 GPT-5.2 降低了 33%。
在 ChatGPT 内部,GPT-5.4 Thinking 针对复杂查询将提供工作思路大纲,同时允许用户在模型生成回应的过程中随时调整或修改请求。
OpenAI 表示:"这使得用户无需重新开始对话或进行多轮额外交互,即可引导模型精准输出预期结果。"该功能目前已上线 ChatGPT 网页端及安卓应用,iOS 版本则"即将推出"。
GPT-5.4 现已面向 ChatGPT、Codex 及 API 全面推出,其中 GPT-5.4 Thinking 模型将向 Plus、Team 和 Pro 用户开放。此外,针对"复杂任务最高性能需求"的 GPT-5.4 Pro 模型也将通过 API 上线,并向 ChatGPT 企业版和 Edu 用户开放。
近几个月来,OpenAI、Anthropic 以及其他 AI 开发商陆续发布多款新模型,并宣称这些模型能够代表用户完成更广泛的工作任务。这些能力是在此前 AI 工具已经成功帮助开发者提高代码编写和调试效率的基础上进一步扩展的。
这一趋势已经令部分传统软件公司投资者感到不安,因为有人担心,这些传统软件企业未来可能被 AI 公司所取代。










