系列文章:「代码编辑器进化论——从 Vi 到 Vibe Coding」
0. 引言 — Vibe Coding
2025 年 2 月,Andrej Karpathy 发了一条推文,创造了一个新词:
"有一种新的编程方式,我称之为 Vibe Coding——完全沉浸在氛围里,拥抱指数级增长,忘掉代码本身的存在。我总是点'全部接受',不看差异。遇到报错就复制粘贴给 AI,通常它能修好。代码已经超出了我的理解范围,要真正读懂得花很长时间。对于周末的一次性项目来说,这还挺有意思的。"
Vibe Coding 很快成为年度词汇,被 Collins 词典收录。
它描述了一种全新的编程方式:不再逐行敲代码,而是用自然语言描述意图,让 AI 去实现。
上两章,我们走过了终端编辑器的圣战,见证了 IDE 帝国的崛起与 VS Code 的霸权。那些故事的时间跨度是 40 年。
而这一章的故事,浓缩在短短 4 年里,这是一个每天都有新闻,热血沸腾的年代。
从 2021 年 GitHub Copilot 技术预览,到 2025 年 Vibe Coding 成为年度词汇——代码编辑器正在经历它诞生以来最剧烈的变革。
AI 不再只是补全几个字符,它开始写整段代码、整个文件、整个项目。
编辑器的定义正在被重写。程序员的角色正在被重构。
1. AI 补全进化史 — 从 IntelliSense 到 Copilot
故事要从"补全"说起。
代码补全不是什么新鲜事。1996 年,Visual Studio 就有了 IntelliSense——敲一个点号,弹出对象的所有方法和属性。这是基于语法分析的"确定性补全",能补的只是已知的 API。
2018 年,TabNine 出现了。它用机器学习预测你接下来要打的代码,不只是 API 名称,而是整行代码。这是"统计补全"的开始。
但真正的转折点是 2021 年 6 月。
GitHub 发布了 Copilot 技术预览版。背后是 OpenAI 的 Codex 模型——GPT-3 的代码特化版本,在 GitHub 上数十亿行代码上训练。
Copilot 做到了一件前所未有的事:根据注释和上下文,生成完整的函数实现。
你写一行注释:// 计算两个日期之间的天数
Copilot 生成整个函数:参数、逻辑、边界处理,一气呵成。
对很多程序员来说,这是第一次感受到"AI 真的能写代码"。
Cursor 团队在 Lex Fridman 的播客里回忆说:
"那是第一个真正的 AI 消费级产品。我们都是纯 Vim 用户,但 Copilot 让我们迁移到了 VS Code——只为用上这个功能。"
Copilot 的魔力在于:即使它错了,代价也很低。 你只需要再敲几个字符,它就会调整建议。不像聊天机器人,错了要重新开始对话。
2022 年,Copilot 正式商用。微软很快把它整合进 VS Code 和 Visual Studio。
AI 补全从实验变成了标配。
Copilot 用户数指数级增长,到2024年,用户数突破2000万,年收入达到20亿美金。
但 Copilot 只是开始。它能补全代码片段,却不能理解整个项目。它能回答"下一行写什么",却回答不了"这个 bug 怎么修"。
真正的飞跃,需要等待模型能力的下一次突破。
2. Anthropic 时刻 — 从 Sonnet 到 Claude Code 的 18 个月
如果说 Copilot 是 AI 辅助编程的起点,Anthropic 则是 Agentic Coding 的引爆者。
在讲 Anthropic 之前,先说说为什么代码成了大语言模型能力的试金石。
代码有三个独特的特性:可验证(能编译、能运行、能测试)、结构化(语法严格,没有自然语言的模糊地带)、任务明确(需求清晰,成功标准可量化)。这让 SWE-Bench——一个测试 AI 能否修复真实 GitHub issue 的基准——成为衡量"实战代码能力"的黄金标准。
接下来的 18 个月,Anthropic 用一系列发布重新定义了 AI 编程。
Sonnet 3.5: Artifacts
2024 年 6 月,Claude 3.5 Sonnet 发布,SWE-Bench Verified 得分 33.4%,内部 Agentic Coding 评测解决了 64% 的问题。同时发布的 Artifacts 让 AI 在聊天界面里直接生成并运行 Web 应用。
这个功能点燃了一个火种:如果 AI 能直接生成可运行的代码,为什么不让它做更多?
几乎同时,社区涌现出 Cline 和 Aider——让 AI 不只是"补全",而是"执行":读代码、改代码、跑测试、看报错、再修改。这类工具有一个共同的名字:Agentic Coding。
Sonnet 3.5 v2: Computer Use
2024 年 10 月,更新版 Sonnet 发布,带来 Computer Use——AI 能操作桌面,移动鼠标、点击按钮、截屏查看结果。SWE-Bench Verified 从 33.4% 跃升到 49.0%。
Sonnet 3.7: Claude Code
2025 年 2 月,Claude 3.7 Sonnet 成为第一个支持"扩展思维"的混合推理模型。但真正震动程序员圈子的是 Claude Code——Anthropic 官方的命令行 AI Agent,以 Research Preview 形式推出。
我第一时间试用,那个晚上一直用到深夜,一直限流,一直在尝试他的边界。一天 API 用掉几十刀的 token 费用,但根本停不下来,恨不得榨干他每个token的价值 —— 以前花一小时调试的问题,现在靠AI就能解决。
Claude 4: Claude Code GA
2025 年 5 月,Claude 4 系列发布,SWE-Bench Verified 达到 72.5%。Claude Code 正式 GA,从"极客的玩具"变成"生产工具"。同时引入 CLAUDE.md——在项目根目录放一个文件,告诉 AI 这个项目的约定和禁忌,相当于给 AI 一份"新员工手册"。
Sonnet 4.5:VS Code Extension
2025 年 9 月,Sonnet 4.5 发布,SWE-Bench Verified 达到 77.2%。Claude Code 推出 VS Code 扩展,让 Agent 能力直接嵌入最流行的编辑器。
Opus 4.5:最强王者
2025 年 11 月,Opus 4.5 发布。Anthropic 称它为"我们最好的编程模型",用少76%的token用量就能达到了Sonnet 4.5的水平,内部评测表现超越了人类 SWE 候选人。即使有其他很多模型你追我赶,Opus 4.5 仍被最广泛认为是编程的最强王者。
18 个月。SWE-Bench 从 33% 到 77%。从 chatbot 到 Claude Code 到 VS Code 扩展。Anthropic 把 Agentic Coding 从概念变成了现实。
Claude Code 负责人 Boris Cherny 晒出的数据是最好的证明:一个月,259 个 PR,4 万行代码。Claude Code 在用 Claude Code 开发 Claude Code。
3. IDE 的分叉 — Cursor、Windsurf、Kiro 与 Antigravity
VS Code 统治了编辑器市场,但它的架构有一个问题:扩展 API 有限。
你可以写插件做很多事,但你不能改变编辑器的核心交互方式。你不能让 AI 直接修改多个文件并显示差异预览。你不能让 AI 执行终端命令并根据结果决定下一步。
于是,一批创业公司选择了另一条路:Fork VS Code。
Cursor:AI 原生编辑器的标杆
2024 年,Cursor 成了程序员圈子里最热门的话题。
Cursor 是 VS Code 的 fork,但它重新设计了 AI 交互体验。核心功能是 Composer——一个能跨多个文件进行编辑的 AI 代理。
你告诉它:"给这个 API 加上认证中间件",它会分析代码结构、找到相关文件、生成修改方案、显示差异预览,等你确认后应用。
更厉害的是 Cursor Tab——不只是补全当前行,而是预测你接下来要做的整个编辑动作。改完一处,按 Tab,跳到下一个需要改的地方,按 Tab,继续改。
Cursor 团队在访谈中说:
"我们内部的竞争指标是:用户能连续按多少次 Tab?越多越好。"
这背后是一个深刻的洞察:程序员阅读和导航代码的时间,远多于打字的时间。 如果 AI 能预测你的下一步动作,就能大幅减少"低熵操作"——那些确定性高、但必须手动完成的事情。
Windsurf:Cascade 的流动
Windsurf 是 Codeium 推出的 AI 编辑器,也是 VS Code 的 fork。
它的核心是 Cascade 代理。和 Cursor 的 Composer 不同,Cascade 更强调"观察"——它会监控你在终端运行的命令、你打开的文件,默默积累上下文,然后在你需要时给出更精准的建议。
感觉不是"你问它,它答",而是"它一直在看,随时准备帮忙"。
后来 Windsurf 被谷歌收购,成为 Google 在 AI 编辑器赛道的重要布局。
Kiro:Spec-Driven Development
Vibe Coding 是一种极端的工作方式:完全信任 AI,不审查代码,靠直觉和迭代推进项目。对于周末的一次性项目来说,这很高效。但对于生产级代码,这是在赌博。
2025 年 7 月,AWS 推出了 Kiro,它的哲学是 Spec-Driven Development(规范驱动开发),先写需求规范,再让 AI 根据规范生成代码。
Kiro 的工作流是:
每一步都有人工审核,每一步都有文档追溯。
这对快速原型不友好,但对企业级开发很有价值——你知道 AI 做了什么,为什么这样做,出了问题能追溯。
Spec-Driven 的理念很快扩散开来。GitHub 开源了 spec-kit,一套让任何 AI 编辑器都能实现规范驱动开发的工具包。你不需要用 Kiro,也可以在 Cursor 或 Claude Code 里用 spec-kit 管理需求文档和任务清单。
两种范式,服务于不同场景:
- • 现实往往是:原型阶段 Vibe Coding,交付阶段切换到 Spec-Driven
Antigravity:Agent-First 平台
2025 年 11 月,Google 发布了 Antigravity。
Antigravity 的定位是"Agent-First IDE"——不是编辑器里加个 AI 助手,而是整个平台都围绕 Agent 设计。
它有两个视图:
- • Manager View:Agent 的"任务控制中心",你可以同时派出多个 Agent 处理不同任务
更激进的是,Antigravity 的 Agent 可以控制浏览器。它能打开你的应用、点击按钮、填表单、录屏——然后把结果反馈给你。
这意味着 AI 不只是写代码,还能测试代码、验证代码、发现问题。
Google 称之为"Artifacts"——Agent 产出的不只是代码,还有任务清单、实施计划、截图、录屏。你审核的不是代码本身,而是 Agent 的工作报告。
4. 工具与编辑器的融合 — 三种集成方式
上一节讲的是 Fork VS Code 的路线——Cursor、Windsurf、Kiro 这些 AI 原生编辑器。
但还有另一条路线:不做新编辑器,而是让 AI 工具融入现有编辑器。
这条路更务实,也更符合开发者的习惯。目前主要有三种集成方式。
命令行工具:终端里的 Agent
最直接的方式是命令行工具。
Aider 是先驱之一。你在终端里运行它,用自然语言下命令,它读文件、改文件、自动生成 commit。整个过程和编辑器无关——你可以同时打开 VS Code 看它改了什么。
2025 年,三家 AI 巨头不约而同地押注命令行。
Claude Code 来自 Anthropic。你给它一个任务,它自己去读代码、改代码、跑测试、看报错、再修改。
Codex CLI 来自 OpenAI。2025 年 4 月发布,开源(Apache 2.0)。npm install -g @openai/codex,几秒钟装好。
Gemini CLI 来自 Google。2025 年 6 月发布,同样开源,最大的卖点是免费额度极其慷慨——个人用户每分钟 60 次请求,每天 1000 次。
三个巨头,三个 CLI 工具。
为什么都选择命令行?因为终端是 Agent 的原生栖息地。AI 在终端里读文件、跑命令、看输出,比在 GUI 里操作更高效。终端的文本流天然适合 AI 处理。
命令行的优势是灵活。不挑编辑器,不挑 IDE,有终端就能用。你可以用 Vim 写代码,用 Claude Code 干重活,两不耽误。
CLI 形态间接也影响了 agent 框架的架构形态,与其用积木构建,不如直接在 大楼上添砖加瓦。这也间接催生了 Claude Agent SDK,LangChain DeepAgent 的诞生。
编辑器插件:IDE 里的 Agent
但很多开发者不想切换窗口。他们习惯在 VS Code 或 JetBrains 里工作,希望 AI 就在手边。
于是有了插件形态。
Cline 最早走通了这条路——一个 VS Code 插件,让 Claude 能在编辑器里读取文件、执行命令、自主修改代码。不需要切终端,Agent 就在 IDE 侧边栏里工作。
命令行工具的厂商很快跟进。2025 年 9 月,Claude Code 推出了 VS Code 扩展。命令行版本的所有能力——读代码、改代码、跑测试、Plan Mode——都被搬进了侧边栏。
插件生态后续还诞生了很多新兴开源工具,Roo Code、Kilo Code ...
插件的优势是上下文连贯。你在编辑器里选中一段代码,直接问 AI 怎么改。不用复制粘贴,不用描述"第几行到第几行"。
殊途同归
Cursor 从编辑器出发,加入 AI。Claude Code 从 AI 出发,融入编辑器。两条路,殊途同归。
但它们都在做同一件事:缩短 AI 和代码之间的距离。
AI 对话界面和代码执行环境的边界正在模糊。
5. 人机共舞 — 编辑器形态的三次跃迁
前面几章讲了具体的工具和产品,现在让我们拉远视角,看看编辑器这 50 年的宏观演进。
回顾这 50 年,编辑器经历了三次形态跃迁:
第一次:从行到屏。 ed 只能看一行,Vi 让你看到整个屏幕。视野从锁眼变成全景。程序员第一次能"看见"代码的全貌。
第二次:从文本到语义。 IDE 不再只是文本编辑器,它理解代码的结构。IntelliSense 知道对象有哪些方法,重构工具知道变量在哪里被引用。编辑器从"处理字符"进化到"理解代码"。
第三次:从操作到意图。 AI 时代,你不再告诉编辑器"删除第 3 行",而是说"把这个函数改成异步的"。编辑器从"执行命令"进化到"理解意图"。
程序员的核心动作也在变。
Vi 时代,核心动作是"敲"——手指在键盘上飞舞,hjkl 移动,d 删除,y 复制。
IDE 时代,核心动作是"选"——从补全列表里选方法,从重构菜单里选操作,从搜索结果里选文件。
AI 时代,核心动作是"审"——AI 生成代码,你审查、接受、修改、拒绝。
代码中有大量"低熵操作"——确定性高、但必须手动完成的事情。改完一处,下一处改什么,AI 能预测。编辑器从"等待输入"变成"主动建议"。
编辑器的界面也在适应这个变化。
传统编辑器的核心是文本区域——你在这里敲代码。AI 编辑器的核心是 diff 预览——你看到的不是"代码是什么",而是"代码要变成什么"。
从 1976 年的 Vi 到 2026 年的 AI 编辑器,编辑器的本质始终没变:把人类的意图转化为机器能执行的代码。 只是这个转化过程越来越短。
Vi 时代,一个字符一个字符地敲。IDE 时代,用重构菜单批量修改。Copilot 时代,写注释,AI 写代码。Agent 时代,描述需求,AI 实现整个功能。
抽象层级越来越高,人类的输入越来越"意图化"。
但每一次抽象都有代价。就像从汇编到 C,失去对寄存器的控制。C 到 Python,失去对内存的控制。代码到自然语言,失去对实现细节的控制。你用便利换取了控制权。
编辑器的终极形态是什么?也许不是某个具体的软件,而是一种新的人机协作模式:人类负责判断、品味、决策,AI 负责执行、验证、迭代。
编辑器不再只是写代码的工具,而是人机协作的界面。
6. 尾声 — 程序员的未来
2025 年 12 月 27 日,Andrej Karpathy 发推:
作为程序员,我从未感到如此落后。这个职业正在被剧烈重构……某种强大的外星工具被分发下来,但它没有说明书,每个人都得自己摸索怎么握住它。
现在的代码编辑器已经从传统工具变为外星工具。
用户也在变化,我见过周边太多的人,无论什么行业,无论是否是程序员,装上了 Cursor,装上了 Claude Code,装上了 Kiro,成为了自己的生产力工具。
程序员不会消失,但程序员的定义正在被重写。也许未来每个人都会用编程构建自己的工具,代码编辑器更会成为每个人与机器最重要的接口。
你的下一个代码编辑器,何必是编辑器。
你的下一个代码编辑器,何必用来写代码。
往期回顾:
代码编辑器进化论(上)—— 神之编辑器与编辑器之神
代码编辑器进化论(中)—— 从 IDE 帝国到 VS Code 霸权