Karpathy 最新 AI 编程笔记,马斯克评「对时代精神的最佳总结」
Andrej Karpathy 这两天发推,分享过去几周大量使用 Claude Code 的一些笔记,超过 600 万人学习。内容不长,但「一如既往,观点深刻、逻辑缜密」(Claude Code 之父 Boris Cherny 的评论)。马斯克更是盛赞,这是对时代精神的最佳总结(Sums up the zeitgeist).Karpathy 说, LLM Agent (尤其是 Claude 和 Codex)在 2025 年 12 月跨越了连贯性鸿沟,并引发了 Coding 领域的一次跃迁。这个跃迁的标志是:人类和 AI 写代码的比例从 8:2 逆转成 2:8。Karpathy 说他现在主要用英语编程(I really am mostly programming in English now)——有意思的是,如果你关注 Karpathy 的推特,会发现这正是他当年的预言:2023 年 1 月 25 日,Karpathy 发推「The hottest new programming language is English」(最热门的新编程语言是英语)Karpathy 认为,这种跃迁带来的不仅是编程速度、韧性的提升,更是能力边界、编程趣味性/创造性的提升。主要作用还不是「让原来要做的事更快完成了」,而是「做了更多原来不会做的事」。同时,Karpathy 也非常敏锐地预判了 2026 年既是创造爆炸之年,也是 AI 电子垃圾之年——无论是 AI 内容,还是大部分流于炒作的生产力工具。——非常认可,虽然我大概率也是其中之一,但仍然感觉大部分人高估了「人人都可以做产品」的实际价值。Karpathy 推测,应该有两位数百分比的工程师已经在适应这种新的 AI Coding 工作方式,但普通人几乎对此毫无感知。而 2026 年,或早或晚,整个行业、所有人都将会面对这股全新力量的冲击。内容实在太精彩,我读了很多遍,决定翻译并分享给大家。有很多感受和细节,应该深入 Vibe Coding 过的同学都能心领神会,也难怪马斯克说是对时代精神的最佳总结(Sums up the zeitgeist),enjoy:
过去几周大量使用 Claude Code 编程的一些笔记。工作流的转变
随着 LLM 编程能力的提升,我的工作流在几周内发生了剧变——11 月:80% 手写 + 自动补全,20% 用 Agent。12 月:80% Agent,20% 手动修修补补。有点不好意思,但确实如此——用文字告诉 LLM 该写什么代码。虽然伤自尊,但用大块的「代码动作」来操控软件,实在太有用了。尤其当你适应它、配置好它、学会怎么用、搞清楚它能做什么不能做什么之后。我估计,两位数百分比的工程师正在经历类似的转变。但大众对此的感知,可能还停留在个位数。IDE、Agent 群、以及模型的缺陷
「不需要 IDE 了」和「Agent 群」这两个 hype,我觉得现在都言之过早。模型还是会犯错。如果你在乎你的代码,最好像老鹰盯猎物一样盯着它,旁边开个大 IDE。只是错误的类型变了——不再是简单的语法错误,而是微妙的概念性错误,像一个有点马虎、有点急躁的初级开发者会犯的那种微妙的概念性的错误。模型替你做了错误的假设,然后一路狂奔,根本不停下来确认。它们不会管理自己的困惑,不会主动澄清,不会指出矛盾,不会呈现 tradeoff,不会在该 push back 的时候 push back,还是有点太谄媚了。Plan Mode 下会好一些,但还需要一个更轻量的内联版本。它们还特别喜欢把代码和 API 搞复杂——堆砌抽象、死代码不清理。它们会用 1000行写出一个低效、臃肿、脆弱的实现,然后你说「呃……你不能直接这样吗?」它会说「当然可以!」然后立刻砍到 100 行。它们有时还会擅自改掉或删掉它们不喜欢、或没完全理解的注释和代码——即使跟当前任务无关。这些问题,即使在 CLAUDE.md 里写了简单的指令,也不能完全避免。简而言之,我目前的工作流是左边开几个 Claude Code 终端,右边开 IDE 看代码 + 手动修改。韧性
它们永远不会累,永远不会泄气,就是一直试、一直试——换作人类,早就放弃了,改天再战。看它卡了很久,30 分钟后终于搞定——这是一个「感受 AGI」的时刻。你会意识到:耐力,是工作的核心瓶颈之一。 有了 LLM,这个瓶颈被大幅提升了。加速
我确实感觉做事快了很多。但主要的效果不是「让原来要做的事更快完成了」,而是「做了更多原来不会做的事」。2. 我可以碰以前因为知识/技能不足而碰不了的代码。杠杆
LLM 特别擅长的事情是:循环执行,直到达成目标。MCP。先让它写一个大概率正确的朴素算法,再让它在保证正确的前提下优化。把你的指令方式从「命令式」改成「声明式」,让 Agent 跑更长的循环,获得更大的杠杆。乐趣
我没想到的是:用 Agent 编程,反而更好玩了。因为那些填空式的苦力活被移除了,剩下的是创造性的部分。我也更少感到卡住(卡住不好玩),更有勇气去尝试——因为几乎总能和 Agent 协作推进。LLM 编程会让工程师分化:喜欢「编程」的人,和喜欢「造东西」的人。萎缩
生成(写代码)和辨别(读代码)是大脑里不同的能力。编程有很多细碎的语法细节,你可以完全看懂代码、却写不出来。垃圾内容末日
我在为 2026 做心理准备——那将是「垃圾内容大爆炸」之年。GitHub、Substack、arXiv、X/Instagram……所有数字媒体都会沦陷。在真实改进之外的那些,我们还会看到更多炒作的「AI 生产力表演」(这还有可能吗?)。几个问题
- 「10X 工程师」会怎样?——平均和顶尖工程师之间的生产力差距,可能会大幅拉大。
- 有了 LLM,通才会越来越胜过专才吗?——LLM 更擅长填空(微观),不擅长大战略(宏观)。
- 未来的 LLM 编程会是什么感觉?——像打星际?像玩 Factorio?像演奏音乐?
总结
LLM Agent 的能力(尤其是 Claude 和 Codex)在 2025 年 12 月前后跨过了某种「连贯性阈值」,引发了软件工程及其相关领域的相变。智能本身的进步速度突然远超其他部分——工具集成、知识库、新的组织流程和工作方式、更广泛的扩散……2026 年将是高能量的一年。整个行业都在消化这波新能力。
最后,拉一个小白 Vibe Coding 群,希望和不懂甚至畏惧代码的同学(其实就是我🐶)一起学习,包括但不限于产品/运营/设计/普通用户……