新智元报道

编辑:peter东

【新智元导读】Cursor提出AI编程「第三时代」:云端智能体具备计算机使用能力,可自主规划、编码、调试、交付,35%代码已由AI完成,程序员转型AI协作架构师。

AI编程的权力结构正在重排:

Cursor披露的数据与用法迁移,正在把这条曲线清晰地画出来。

Cursor CEO:AI软件开发的第三时代

最近,AI编程工具Cursor CEO Michael Truell有感而发,划分了AI软件开发的三个时代。


回顾过去五年,AI赋能软件开发可分为三阶段,每一阶段的用时越来越少。

第一阶段发生在2024年,以Tab自动补全为标志。GitHub Copilot等产品让AI成为「超级输入法」,擅长处理低熵、重复性代码片段。这一阶段的核心价值是「效率杠杆」——开发者仍主导逻辑设计,AI负责减少击键次数。

第二阶段发生在2025下半年,伴随智能体能力的崛起。模型上下文窗口扩大、工具调用能力增强,这让开发者可以通过「提示-响应」的同步循环,指挥AI编写特定模块。但此时的人机交互仍是「手把手」模式:每一步决策、每一段输出,都需要人类实时审阅与纠偏。

在过去一年中,Cursor中的智能体使用量增长了超过15倍。如今,大多数Cursor用户几乎不会再按Tab键。

2025年3月,Cursor的Tab用户数量大约是智能体用户的2.5倍。现在情况已经反转,智能体用户数量是Tab用户的2倍


当下,AI编程的第三阶段正在加速降临。

Cursor团队在最新博客中提出:新一代智能体将具备在更长时序上自主规划、迭代与交付的能力。它们不再依赖开发者逐条指令,而是像一组资深工程师注册的开发团队,接收目标、拆解任务、调用工具、验证结果,最终以」可评审的工件」形式,向用户交付成果。

云端Agent,

开启并行开发新范式

第三阶段的AI辅助开发,与之前究竟有何不同之处,还需要从第二阶段本地运行的智能体说起,尽管这一阶段看起来不会持续一年时间,却是承上启下的关键。

与Tab相比,智能体在更高的抽象层上工作。它们处理需要上下文,在完成任务时运用判断力,但每一步都需要开发者参与其中。这种实时地交互,再加上智能体会在本地机器上竞争资源这一事实,意味着在同一时间实际可用的智能体只能是少数。

而云端智能体就不存在资源和注意力瓶颈。每个智能体运行在自己的虚拟机上,让开发者可以将任务交给它处理,然后转去做别的事情。智能体会在数小时内持续工作,反复迭代和测试,直到对输出足够有信心,并以一种便于快速审阅的形式,例如日志、视频录像和实时预览等方式向用户汇报进展。

由于智能体提供的预览为用户提供了足够的上下文来评估输出,而无需从零重建每个会话。人的角色也从逐行引导代码编写,转变为定义问题并设定评审标准。


资源解耦与富媒体交互使并行运行多个智能体变得切实可行。

这反映到数据上,就是在Cursor内部的代码提交中,已有35%是由在云端虚拟机中自主运行的智能体创建的。开发者用脚投票,选择了云端智能体这种更高效的方式。

实战场景

智能体如何完成复杂任务

Cursor展示了云端Agent在真实开发场景中的四大应用,分别是

1 构建新功能:智能体接收「为插件组件添加源码链接」的指令后,自主解析文件结构、构造GitHub链接、更新前端逻辑,并录制自己点击验证链接有效性的全过程视频,最终提交可直接合并的代码提交。

2 复现安全漏洞:面对「剪贴板窃取」漏洞描述,智能体自主构建HTML演示页面、启动本地服务器、在应用内浏览器中加载并执行攻击流程,最终输出包含操作录像与截图的详细分析报告,大幅降低安全团队的复现成本。

3 UI自动化测试:智能体对文档站点进行45分钟全流程走查,测试侧边栏、搜索、主题切换等十余项功能,自动生成测试总结与异常截图,将QA效率提升数倍。

4 快速修复与验证:针对「Lint标签动态更新」需求,智能体不仅实现逻辑代码,更在桌面应用中分别测试「有错误」与「无错误」两种状态,录制验证视频确保修复效果符合预期。

这些场景的共同特征是:Agent不再局限于「生成代码片段」,而是具备「端到端交付可验证功能」的完整能力链。

人机重构

程序员成为「AI车队」指挥官

软件开发正变得如自动驾驶一般流畅,在这个未来里,智能体会合并代码提交、管理发布和监控生产环境。我们将从一个开发者使用智能体来创建代码的世界,走向一个由智能体端到端交付已测试功能的世界。

要真正实现这一转变,需要持续改进工具链、模型以及交互模式。开发者在云端智能体时代,需要能协调多智能体间的协同工作,并构建能够从过往运行中学习、随着经验积累而变得更高效的模型。

采用云端智能体这种全新工作方式的开发者通常具有以下三个特征:

    几乎100%的代码都由agent编写。

    他们把时间花在拆解问题、审查结果以及提供反馈上。

    他们会同时启动多个agent,而不是手把手地引导单个agent直至完成。

在这种范式下,AI能写多少代码,取决于人类开发者如何重新定位自身价值。

开发者需要培养的技能要从「手写优雅代码」转向「精准定义问题边界」,「设计鲁棒的验收标准」以及「高效协调多智能体协作」。

编程语言的语法细节或许不再关键,但系统思维、领域知识与质量判断力将变得愈发珍贵。

在这种方式成为软件开发的标准实践之前,还有大量工作要做。在大规模的工业化场景下,那些单个开发者能绕过的不稳定测试,或是被损坏的运行环境,会演变成导致智能体每次运行都被中断的故障。

AI编程工具的开发者需要确保智能体能尽可能高效地运作,并完整获取其所需的工具和上下文。

此外,对于像飞机控制软件这样的涉及生命的场景,人们对智能体开发对软件普遍信心不足。如何确保智能体不会因为幻觉而不进行相应的测试,也需要开发者关注。

参考资料:

https://cursor.com/cn/blog/agent-computer-use

https://cursor.com/blog/third-era

https://x.com/mntruell/status/2026736314272591924

https://x.com/iruletheworldmo/status/2028077803975930342