兄弟们,AI安全审计这件事,真的来了。
Anthropic研究科学家Nicholas Carlini在[un]prompted大会上公布了一个震撼成果——用Claude Code,在Linux内核中发现了5个可远程利用的零日漏洞。
其中一个,在NFS驱动里潜伏了整整23年,比git诞生还早。
发现过程?简单到离谱
没有自定义工具,没有复杂提示词。
Carlini的做法就是:让Claude Code逐个扫描Linux内核源码文件,告诉它"你在参加CTF比赛,找漏洞"。
就这三步:
●• 逐文件扫描——每次只看一个文件,避免上下文过载
●• CTF场景设定——激活模型的攻防思维
●• 自动验证——模型自己跑验证步骤,误报率低于20%
就这么简单。
那个23年的漏洞
NFS驱动里的一个堆缓冲区溢出,2003年的一次提交引入的。
攻击原理一句话——
服务器准备了112字节的碗,却倒进了1056字节的水。
两个NFS客户端配合操作就能触发,远程利用,不需要本地权限。
23年,无数人工审计都没发现。
能力跃迁有多快?
Carlini做了对比实验,结果很震撼——

图1:8个月内漏洞发现能力跃迁
●• 8个月前的Claude Opus 4.1 → 只能发现一小部分
●• 6个月前的Claude Sonnet 4.5 → 仍然只是一小部分
●• 现在的Claude Opus 4.6 → 5个已确认零日 + 数百个待验证崩溃点
短短几个月,能力提升了一个数量级。
行业已经炸了
Linux内核维护者Greg Kroah-Hartman的原话——
"大约一个月前发生了某些变化,整个世界都不一样了。现在我们收到的是真实报告。"
另一位维护者Willy Tarreau的数据——
"内核安全列表的报告量已从每周2-3条上升到每天5-10条,而且大多数都是正确的。"
Redis创建者antirez的评价——
"验证步骤正越来越多地由模型自身完成。误报通常会在进入人工审查前就被剔除。"
AI安全审计从"未来可能"变成了"正在发生"。
️ 双刃剑:攻防都在用

图2:攻防双面性雷达对比(重叠)
这件事不只是好消息——
✅ 好消息: 安全团队可以用AI审计自家代码,门槛大幅降低
❌ 坏消息: 攻击者也能用同样流程扫描目标系统,批量挖漏洞
同样的工具,目标不同,结果天差地别。

图3:推荐安全审计工作流
对普通开发者的影响——
●• 你的老代码里很可能也有类似问题——别以为"没出事就没事"
●• 补丁压力增大——AI发现的漏洞远超人工时代
●• 把AI审计纳入开发流程——这很快会成为标配
如果你想在项目中试试,推荐这个流程:
AI初筛 → AI交叉验证 → 人工复核 → 修复+回归测试
模型选择上,当前Claude Opus 4.6在安全审计场景最强,但建议多模型交叉验证——不同模型对不同漏洞敏感度不同,互补性强。
最后两句
23年的漏洞,就这样被挖出来了。
AI安全审计的时代不是"快来了"——它已经到了。
兄弟们,别等。现在就跑一遍自己的项目,你可能会惊讶于它能发现什么。
信息来源:[un]prompted大会、LWN、Reddit、Hacker News
免责声明:本文基于公开信息整理,仅代表个人观点。