2025 年 3 月,OpenAI 发布技术博客《Using O3 to discover a novel exploit in the Linux kernel》,宣布他们的 o3 推理模型成功发现了一个 Linux 内核的零日漏洞——这是一个此前未被报告过的 Use-After-Free(UAF)漏洞,位于内核的网络子系统中。
消息一出,安全圈炸了。
有人欢呼:「AI 终于可以自动挖洞了!」有人质疑:「这只是巧合吧?」更有人担忧:「如果 AI 能挖洞,那攻击者是不是也能用 AI 批量制造漏洞?」
今天,从一个 AI 安全研究者的角度,聊聊这件事的意义、局限,以及它对未来安全研究的影响。
先科普一下:什么是零日漏洞?
零日漏洞(Zero-Day Vulnerability)是指软件厂商尚未知晓、未发布补丁的安全漏洞。因为「零天」的修复时间,攻击者可以利用它发动攻击,而防御者几乎无法防范。
发现零日漏洞一直是安全研究的「圣杯」——它需要深厚的专业知识、丰富的经验,以及大量的时间投入。
一、o3 到底发现了什么?
根据 OpenAI 官方博客披露的信息:
| 项目 | 详情 |
| 漏洞类型 | Use-After-Free(UAF,释放后使用) |
| 影响组件 | Linux 内核网络子系统(net/ipv4/ 相关代码) |
| 发现方式 | o3 在分析内核代码 diff 时,通过多步推理识别内存管理缺陷 |
| 验证结果 | 人工确认后,确认为零日漏洞,此前未在 CVE 数据库中记录 |
| 修复状态 | 已报告给 Linux 内核安全团队,补丁开发中 |
这是目前公开报道的、第一个由大模型独立发现并得到验证的内核级零日漏洞。
二、o3 的技术原理:为什么它能做到?
o3 不是普通的 GPT-4,它是 OpenAI 最新发布的推理模型(Reasoning Model)。与标准 LLM 的最大区别在于:
o3 是推理模型(Reasoning Model),与标准 LLM 的最大区别在于:推理模型会在回答前进行「内部思考」,模拟人类的分析过程。
1. Chain-of-Thought 在漏洞挖掘中的作用
o3 发现漏洞的过程展示了典型的「思维链」模式:
第一步:分析代码变更的上下文 → 第二步:识别内存分配和释放的模式 → 第三步:追踪指针生命周期 → 第四步:构造触发路径 → 第五步:验证漏洞可利用性
这种多步推理能力,让 o3 可以处理复杂的、需要上下文关联的漏洞类型。
2. 工具调用增强能力
| 工具类型 | 作用 |
| 静态分析器 | 检查代码结构、函数调用关系 |
| 符号执行引擎 | 验证理论上的执行路径是否可达 |
| 模糊测试器 | 生成测试用例,验证崩溃 |
三、o3 vs 现有工具:谁更强?
| 维度 | o3(推理模型) | CodeQL(静态分析) | AFL(模糊测试) |
| 发现方式 | 语义理解 + 推理 | 模式匹配 | 随机变异 + 覆盖率引导 |
| 误报率 | 中等(需人工验证) | 高(大量误报) | 低(崩溃即漏洞) |
| 适用场景 | 复杂逻辑漏洞 | 已知模式漏洞 | 输入处理漏洞 |
| 计算成本 | 高(推理耗时) | 低 | 中等 |
关键差异:CodeQL 需要你「告诉」它要找什么模式;AFL 需要你能「运行」目标程序;o3 可以「理解」代码意图,主动发现未知模式。
四、这意味着什么?
1. AI 漏洞挖掘进入实用阶段
以前,AI 辅助漏洞挖掘更多是「辅助」——帮助分析师快速浏览代码、标记可疑位置。现在,o3 展示了一种可能性:AI 可以独立完成从分析到验证的全流程。
2. 攻防平衡可能被打破
传统上,漏洞挖掘需要深厚的专业知识和大量时间投入。这限制了漏洞发现的速度,给了防御方相对充足的时间窗口。如果 AI 可以批量、自动化地发现漏洞,漏洞产出速度将指数级增长。
五、但别急着欢呼——技术局限性分析
1. 样本量问题
目前公开的案例只有一个。一个成功案例不能说明问题,我们需要看到在大规模代码库上的检出率、误报率。
2. 计算成本与经济可行性
o3 的推理成本不低。据估算,一次深度分析可能需要数美元的 API 费用。对于企业级代码库,全量扫描的经济成本可能难以承受。
3. 复杂漏洞的局限性
Linux 内核的复杂性超出了当前 LLM 的能力边界:
-
- 跨函数漏洞:需要追踪多个函数间的状态变化,上下文窗口可能不足
-
- 竞态条件:涉及并发执行时序,静态分析难以捕捉
-
- 逻辑漏洞:需要理解业务逻辑,而非单纯的内存问题
-
4. 对抗性考虑
如果攻击者也能使用类似的 AI 工具,他们可能会更快地发现 0day、自动化漏洞利用开发、批量扫描互联网资产。这是一场军备竞赛。
六、给安全从业者的建议
1. 拥抱变化:AI 不会取代安全研究员,但会用 AI 的安全研究员会取代不会用的。
2. 深耕专业领域:AI 擅长模式识别,但缺乏领域直觉。深挖某一垂直领域,建立 AI 难以复制的经验壁垒。
3. 关注对抗性 AI 安全:研究如何让 AI 更鲁棒地处理恶意输入,如何检测 AI 生成的攻击代码。
七、结语
OpenAI o3 发现 Linux 内核零日漏洞,是一个里程碑式的事件。它证明了:AI 不仅可以「辅助」安全研究,还可以「主导」漏洞发现。
但这并不意味着人类研究员的终结。相反,这是一个新的开始——
人机协同,才是未来漏洞挖掘的主流形态。
o3 是工具,不是对手。会用工具的人,永远是赢家。
延伸阅读
- OpenAI 官方博客:《Using o3 to discover a novel exploit in the Linux kernel》
- Linux Kernel Security: kernel.org/doc/html/latest/security/
- OWASP LLM Top 10