Simon Willison,Datasette 创始人,目前全职开发基于 SQLite 的数据新闻工具。他曾任 Eventbrite 工程总监,是 Django 联合创始人及 YC 资助的 Lanyrd 联合创始人。
如果你问现在的程序员“AI能不能写出好代码”,大概率会得到两种截然不同的答案:有人把AI当贴身助手,有人骂它写的全是“垃圾”。但在AI研究者西蒙·威利森眼中,这种争论很快就会有结果——他在近期的《氧化物与朋友》播客中,抛出了关于大型语言模型(LLM)在编程领域的一系列预测,从1年到6年,勾勒出一幅AI重塑编程行业的清晰图景。
有意思的是,西蒙和播客主持人都提到了一个共同感受:从未对未来如此不确定。就像我们看着一辆加速的列车,知道它会驶向新方向,却看不清具体的站台。而这份不确定的核心,正是“编码Agent”(你可以理解为“AI编程助手”)的爆发式进展。接下来,我们就一层层拆解这些预测,搞懂它们到底意味着什么。
分享给“Oxide and Friends”的关于 2026 年 LLM 的预测
周二,我参加了“Oxide and Friends”播客的录制,探讨了对科技行业未来 1 年、3 年和 6 年的预测。这是我第二次参加他们的年度预测节目。
Bryan Cantrill 以声明开场,称他对未来一年将发生的事情前所未有的不确定。我有同样的感觉——仅在过去两个月里,代码智能体取得的重大进展让我确信局面将发生重大变化,但对于具体会是怎样的变化,我尚不清楚。
以下是我在节目中分享的预测。
- 1 年:LLM 能编写优质代码将成为不可否认的事实
- 1 年:代码智能体安全领域将发生一次“挑战者号灾难”
- 3 年:软件工程领域中代码智能体的“杰文斯悖论”将得到解决(无论以何种方式)
- 3 年:有人将主要利用 AI 辅助编程构建一个新的浏览器,而这甚至不会令人惊讶
1 年:LLM 能编写优质代码将成为不可否认的事实
我认为目前仍有一些人坚信 LLM 无法编写出好的代码。这些人将在 2026 年遭受极大的冲击。我认为,即使再过三个月,如果不放弃“LLM 写的代码全是垃圾,且任何像样的人类程序员都能写出比它们更好的代码”这一观点,恐怕都很难撑得下去。
在 2023 年,说 LLM 写的是垃圾代码是完全正确的。在 2024 年的大部分时间里,这依然成立。但在 2025 年情况发生了变化,尽管如果你坚持旧有观点,也情有可原。然而到了 2026 年,LLM 生成代码的质量将变得无法否认。
这一结论基于我个人的经验——我在探索 AI 辅助编程上花费的时间比大多数人都要多。
2025 年的关键变化是引入了专门针对代码使用强化学习训练的“推理模型”。各大实验室花了一整年时间竞争,看谁能从模型中获得最佳的代码能力,而这个问题恰好非常适合强化学习,因为代码挑战带有内置的可验证成功条件。
自从 Claude Opus 4.5 和 GPT-5.2 分别在 11 月和 12 月发布以来,我手写的代码量已降至我总产出的个位数百分比。我认识的许多其他专家程序员也是如此。
在此时,如果你仍继续争辩说 LLM 写的代码毫无用处,那你是在损害你自己的公信力。
1 年:我们终将解决沙箱隔离问题
我认为今年我们将解决沙箱隔离问题。我想在我的计算设备上运行别人编写的代码,而不必担心如果这些代码是恶意的或带有缺陷,会毁掉我的设备。……这太荒谬了,都 2026 年了,我仍然会随机复制代码并以一种能窃取我所有数据并删除所有文件的方式执行它。……我不想在我的任何设备上运行任何人在沙箱之外编写的代码。
这不仅仅关乎 LLM,但由于现在有更多的人在编写代码——往往是在不清楚自己在做什么的情况下——这变得更为重要。沙箱隔离也是对抗“提示注入”攻击的关键一环。
我们已经拥有了许多在这方面大有可为的技术——容器和 WebAssembly 是我最看好的两项。解决这个问题具有真正的商业价值。技术组件已经具备,现在需要的是在用户体验(UX)方面的工作,以减少在高效且安全地使用它们时的摩擦。
1 年:代码智能体安全领域将发生一次“挑战者号灾难”
我认为我们在代码智能体安全方面迟早会遭遇一次“挑战者号灾难”……我认为很多人,包括我自己,实际上都是以 root 权限运行这些代码智能体的,对吧?我们让它们做所有这些事情。每次我这么做,我的电脑都没有被清空。我就想,“哦,没事的”。
我借此机会推广我近期最喜欢的一篇关于 AI 安全的文章:Johann Rehberger 写的《AI 中的偏差常态化》。
“偏差常态化”描述的是这样一种现象:个人和组织习惯于在不安全的状态下运作,因为迄今为止还没发生过什么坏事,但当他们的好运耗尽时,可能会导致巨大的问题(就像 1986 年的挑战者号灾难)。
每六个月我就会预测一次,即将发生轰动一时的提示注入攻击,而每六个月都没发生。这是我最近一版的这个预测!
1 年:鸮鹦鹉将迎来一个极佳的繁育季
我认为新西兰的鸮鹦鹉将迎来一个极佳的繁育季。我之所以这么认为,是因为瑞姆树目前正在结果。这种鹦鹉只剩下 250 只,而且只有在瑞姆树大年结果时它们才会繁殖。自 2019 年以来,瑞姆树的情况一直很糟糕,但今年瑞姆树全部开花了。研究人员表示,所有 87 只适龄雌鸟都可能产下一枚蛋。对于一个仅剩 250 只鹦鹉的物种来说,这是一个天大的好消息。
(我刚查了维基百科,我对鹦鹉数量的估计是对的,但关于上一个繁育季好的年份错了,显然 2022 年也是个好年份。)
在这一年鲜有好消息的情况下,我非常高兴能分享这个故事。更多信息如下:
- 保护部发布的 2026 年鸮鹦鹉繁育季介绍(2025 年 6 月)。
- 奥克兰大学:鸮鹦鹉即将迎来丰收繁育季(2025 年 12 月 3 日)。
我不经常在这个博客上使用 AI 生成的图片,但 Oxide 团队为这集节目创作的鸮鹦鹉图片简直太完美了:
一只美丽的绿色鸮鹦鹉被蜡烛包围,凝视着水晶球。
3 年:软件工程领域中代码智能体的“杰文斯悖论”将得到解决(无论以何种方式)
我们将弄清楚杰文斯悖论是会拯救我们的职业生涯,还是毁掉它。这是目前每位软件工程师面临的一个重大问题:我们正在将编写可用代码的实际成本降低到过去的一小部分。这是否意味着我们的职业价值彻底贬值,我们都得学着靠以前十分之一的收入生活?还是这意味着,对软件、特别是定制软件的需求将增长 10 倍,而我们的技能因此变得更有价值,因为你可以雇佣我,我能为你构建出以前 10 倍数量的软件?我认为三年内我们就能确定究竟会是哪条路。
这句话说明了一切。关于代码智能体的发展有两种可能:要么结果证明软件工程技能贬值了,要么结果证明我们比以往任何时候都更有价值、更高效。
我在祈祷是后者!目前为止,我的感觉是局势正朝着那个方向发展。
3 年:有人将主要利用 AI 辅助编程构建一个新的浏览器,而这甚至不会令人惊讶
我认为有人将主要利用 AI 辅助构建一个完整的网络浏览器,而这甚至不会令人惊讶。开发一个新的网络浏览器是我能想象的最复杂的软件项目之一……作弊代码就是“一致性测试套件”。如果有现成的测试,事情会变得容易得多。
如今,AI 编程怀疑论者的一个常见抱怨是,LLM 只能用于玩具项目,不能用于任何大型且严肃的项目。
我认为在 3 年内,这种观点将被彻底证明是错误的,甚至到了不再具有争议性的地步。
我在这里选择网络浏览器作为例子,是因为构建浏览器的大部分工作都涉及编写必须符合大量且令人生畏的正式测试以及非正式的“野生”网站的代码。
代码智能体非常擅长处理那些可以定义具体目标,然后让它们向着该目标迭代工作的任务。
网络浏览器是我能想到的最雄心勃勃的项目,它恰好能充分利用这些能力。
6 年:手写代码将像穿孔卡片一样成为历史
我认为那种靠把代码敲进计算机来赚钱的工作,将像打穿孔卡片一样成为历史……在六年后,我不认为还有人会被雇佣仅仅是为了做敲代码这件事。我认为软件工程仍然会是一个巨大的职业领域。我只是认为软件工程师不会再一天花几个小时在文本编辑器里敲语法了。
我在 AI 辅助编程上花的时间越多,我对我的工作就越不感到恐惧,因为事实证明,构建软件——尤其是以现在可能的构建速度——仍然需要巨大的技能、经验和深刻的理解力。
不过,技能正在转变!能够阅读详细规范并将其转化为代码行,这正是正在被自动化取代的部分。剩下的就是“其他所有事情”,而我在与代码智能体共事上花费的时间越多,这个“其他所有事情”的范畴就变得越大。
我的一点思考:技术变革的核心,是“人的价值重定义”
西蒙的这些预测,看似在说AI技术的发展,本质上是在探讨“技术与人的关系”。从1年内的“争议终结”,到3年内的“行业重塑”,再到6年内的“工作方式革命”,核心逻辑都是:AI会替代重复的、机械的工作(比如敲代码、核对语法),但永远替代不了人的经验、思考和创造力。
对于普通人来说,这意味着不用再害怕“AI抢饭碗”,而是要学会和AI协作;对于程序员来说,这不是“失业预警”,而是“技能升级提醒”——未来的核心竞争力,不再是“写代码的速度”,而是“用AI解决问题的能力”。
就像西蒙说的,虽然未来充满不确定,但唯一能确定的是:技术会一直向前,而人的价值,永远在于那些“机器做不到的事”。而我们要做的,就是提前看清方向,做好准备,和AI一起走向更好的未来。