OpenAI发布GPT-5.4新模型：原生操控电脑，迈向自主智能体新时代,gpt2开源

北京时间3月6日，OpenAI正式推出全新一代大模型GPT-5.4，该模型集推理、编码、智能体工作流于一体，原生支持电脑操作并搭载100万token上下文，被官方定义为“迄今能力最强、效率最高的专业工作前沿模型”，标志着AI向自主智能体迈出关键一步。

GPT-5.4深度融合GPT-5.3-Codex领先的编码能力，全面优化工具协同、跨软件运行与专业办公能力，可高效完成电子表格、演示文稿、文档处理等任务，大幅减少交互成本，精准高效落地复杂实际工作。官方数据显示，该模型事实准确性显著提升，错误率较GPT-5.2降低33%，多源信息整合与“大海捞针”式精准检索能力大幅增强。

作为OpenAI首款原生具备电脑操作能力的通用大模型，GPT-5.4可依据屏幕画面自主执行键盘、鼠标指令，跨设备、跨应用完成复杂工作流，实现从被动响应到主动执行的突破。同时，模型支持最高100万token上下文，可支撑长周期任务的规划、执行与全流程验证，工具搜索效率进一步提升，能更精准调用各类工具与API。

在ChatGPT端，GPT-5.4 Thinking新增思考过程前置展示功能，用户可在模型运行中实时调整需求，无需重复交互即可获得更贴合预期的结果。该模型深度网页检索能力升级，长上下文保持更稳定，目前已登陆网页版与安卓端，iOS版即将推出。

业内评价，GPT-5.4将原生电脑操控、超长上下文、强推理与编码能力集于一身，重构AI专业工作范式，加速自主智能体时代到来，将深刻影响办公、开发、内容生产等全场景AI应用生态。