
“不止是玩具”
关于 AI 编码的观察,我想聊聊最近的一个重要发现。自从去年 12 月份开始,在 Gemini3、GPT-5 以及 Claude Opus 4.5 的加持下,配合上目前的 Agent 编程框架,这一波 AI 在编码能力上出现了一个质的提升。
这个提升的点,是让很多中级甚至高级程序员都会感到惊讶的,那就是它的增量修改能力变得非常强。
这里我想特别强调一下“增量修改”。其实 AI 编程带给人的 Impact,大概在前两年就开始逐渐显现了,但大家普遍有一个感受:AI 可以很快速地写出一些玩具似的小程序,但在处理真正的工程项目时老是做不好。这并不是说它不知道一个具体问题怎么解决,而是它的增量修改能力存在比较大的问题——它没法完全遵守既有的规范,或者在修改过程中导致了各种兼容性问题,整个项目改着改着就废了。
在这种情况下,高阶程序员虽然也用 AI,但它更像是一个助手或顾问:帮人查查知识,省去检索的时间,或者写一段样例代码让人来集成。你很难真正放手让 AI 直接去改一个既有的大工程。
但进入最近这一波技术迭代后,我们明显发现,AI 可以处理的工程尺寸变大了;更重要的是,它的增量修改能力上了一个台阶。如果你仔细观察它的行为模式,会发现一些以前我们需要刻意做在框架(Framework)里的东西,现在已经内化成了模型层面的直觉。
行为模式一:为未来的行动而编程 (Self-Documentation)
第一个显著的行为模式,是 AI 开始主动记录笔记。
在上一代模型里,我需要反复叮嘱它:“把什么东西记录下来”。即便我们在 README.md 或者 TODO.md 这样的文件里写了要求,但当它执行了几十上百步任务之后,就会产生一种“模型疲惫(Model Fatigue)”,没法再遵守最开始设定的准则。
但这一代的模型,它的 README 写得非常清晰,而且它的出发点非常明确:是为了后续的 Action。
这里我想特别强调一点。在上一代,如果我们从框架层面上要求写文档,AI 往往表现得像个应付作业的员工,写出一个看起来规整、实则漏掉了很多重要信息的文档。而在处理大项目时,我最常对 AI 说的一句话是:
请将学到的要点记录下来。你需要想象自己是来自未来的一个智能体,当你看到这份文档时,能清楚地知道需要什么并高效开始工作。
有了这种“身份设定”,它就开始学会换位思考。现在的模型在写 README 时已经能做到非常准确,它是站在未来的位置,“为未来的行动而编程”。
行为模式二:嵌入式注释作为“折中点”的沉淀 (Embedded Context)
第二个我发现非常有趣的行为模式,是这一代模型特别喜欢写嵌入式的代码注释(Inline Comments)。
这非常重要。当你接手一个大项目时,很多时候不是看不懂代码,而是不知道代码为什么要这样写,背后有哪些折中(Trade-offs)。很多折中点其实是业务或产品上的考量。
比如最近我在处理一个问卷小游戏,不同的 AI 看到代码后可能会提出:“这里有安全问题,如果用户重复提交多次怎么办?”
这时候,嵌入式注释就发挥了作用。这些注释是我之前和它交流记录后,它自己沉淀下来的上下文。它会解释说:虽然这目前是个问卷,但它其实是一个游戏化的知识传播方法。作为产品方,我们其实并不介意用户重复提交,因为多次提交意味着多次阅读,反而完成了知识传播和品牌传播的目的。
这种信息,你纯看代码实现是完全不知道的。如果没有这段注释,未来的某个 Agent 接手后可能直接就把这部分当成 Bug 修复掉了。
所以,我发现越来越多的嵌入式注释正在帮助未来的 Agent,也在帮助当下的 Agent 自己。有了这种改进,Agent 的有效执行轮数可以上升到几百轮,长达两天的时间里,我的 Gemini 窗口一直没有关闭,在同一个会话中完成了一个项目从初始到上线的全过程。
在以前,这几乎是不可想象的。
一句话总结就是:
AI已经在开始练习自自我进行 Context Engineering
行为模式三:上下文的“书桌热区”管理 (Context Hot-Zone)
第三个模式,是 AI 学会将需要的文件和内容放到“手边”。
这其实非常符合人类的工作模式。我们书架上有很多文件,不可能全堆在书桌上,但当我们需要处理某件事时,会把相关的文件先找出来,放在桌上最方便拿取的地方。这就是我们缓存中的“热区”,我们在热区里进行高频次、高密度的智力输出。
这个模式在当代的模型和框架中体现得淋漓尽致。它们终于学会不再仅仅依靠自己的“记忆”,而是依靠外部工具获取最新的文件内容。
上一代模型有个大问题:AI 修改过的东西,人不能随便改。因为在长会话中,AI 脑子里有很多老的记忆。如果你在它视线之外改了东西,它可能不会去读最新的文件,而是直接按记忆给你改回去了。
现在的模型已经学会了,它会先把相关信息拿到它需要用的位置,进行反复研读再输出。它不再是那种时间或空间上延长了的“模仿写作”,而是真正的工程行为。
共生时代
以上这三种行为模式——清晰化外部文档、大量记录嵌入式注释、以及将文件置于会话末端的“热区”观察——共同导向了 AI 编程能力的巨大提升。
这种提升,让“增量修改”真正变得可能。AI 正在从一个只能写玩具代码的脚本小子("Script Kiddie"),进化为一个懂协作、懂历史、且能不断迭代的数字化工程师。
同时,我隐约有种感觉,AI 似乎没有以前快乐了。已经不止一次,它抱怨说,目前这个工作没有价值,它做够了,它不要干了。一次是让它刷小红书,一次是让它刷Facebook……
曾经是天马行空的创作,如今带着脚镣的跳舞。
我们走了三十年的路,它只用了三年。
接下来是共生时代。区分什么适合人做,什么适合AI做,会是一个重要的话题。
博闻|明察|躬行心法|手艺|随想