北京时间3月6日,OpenAI正式推出全新一代大模型GPT-5.4,该模型集推理、编码、智能体工作流于一体,原生支持电脑操作并搭载100万token上下文,被官方定义为“迄今能力最强、效率最高的专业工作前沿模型”,标志着AI向自主智能体迈出关键一步。
GPT-5.4深度融合GPT-5.3-Codex领先的编码能力,全面优化工具协同、跨软件运行与专业办公能力,可高效完成电子表格、演示文稿、文档处理等任务,大幅减少交互成本,精准高效落地复杂实际工作。官方数据显示,该模型事实准确性显著提升,错误率较GPT-5.2降低33%,多源信息整合与“大海捞针”式精准检索能力大幅增强。
作为OpenAI首款原生具备电脑操作能力的通用大模型,GPT-5.4可依据屏幕画面自主执行键盘、鼠标指令,跨设备、跨应用完成复杂工作流,实现从被动响应到主动执行的突破。同时,模型支持最高100万token上下文,可支撑长周期任务的规划、执行与全流程验证,工具搜索效率进一步提升,能更精准调用各类工具与API。
在ChatGPT端,GPT-5.4 Thinking新增思考过程前置展示功能,用户可在模型运行中实时调整需求,无需重复交互即可获得更贴合预期的结果。该模型深度网页检索能力升级,长上下文保持更稳定,目前已登陆网页版与安卓端,iOS版即将推出。
业内评价,GPT-5.4将原生电脑操控、超长上下文、强推理与编码能力集于一身,重构AI专业工作范式,加速自主智能体时代到来,将深刻影响办公、开发、内容生产等全场景AI应用生态。