这半年,有个事儿正在悄悄变天。
我们都默认AI这行当的命脉是由OpenAI、Google这些大厂掌控的,一旦他们发点什么新模型,整个行业就跟着跑。但很少有人注意到:真正决定“谁能跑出来”的,往往不是这些巨头发布会上的PPT,而是那些真正在一线干活的程序员和安全研究员。
举个例子。
Claude搞出了两个大新闻:一个是Ghost CMS的漏洞,一个是Linux内核的漏洞。结果你去看网上的讨论、朋友圈的转发,几乎没人真在谈这背后的危险。
你会发现,大家在惊叹,在转发,在凑热闹,但没人真敢把它放进核心业务让AI自动挖漏洞。更没人真把它集成进安全防护系统,或者放到生产环境里去跑。
因为Anthropic其实不傻。
一个模型好不好用,不是看谁吹得凶,而是看真正用过的人敢不敢放手用它。
这也是为什么,现在很多大厂、开源社区、安全团队,都开始不约而同地换掉旧工具了。尤其在编程圈,有个名字正在默默变成“标配”——Claude。
这波AI热潮,走到今天,热闹的一大堆,靠谱的没几个。
但Claude的出现,从一开始就不是靠发布会吹出来的。
它是那种“慢慢爬上来”的选手,平时不声张,但每次出手都一锤一钉,尤其是今年的Mythos 5.0内部代号Capybara,一口气从挖零日漏洞到写内核代码,把安全审计、系统开发、日常编程这些最难的活儿一个个啃下来。
这事在实战圈有多难?
你可以去问一个老程序员:要找一个能挖零日漏洞、支持自动修复、可控性强的AI,你默认会用哪套工具?
不出意外,他会说:Claude。
甚至现在已经变成一种共识了——项目要落地、搞开发,首选就是Claude。
为什么团队开始选Claude?主要在于:
能挖洞,能写码,能可控运行,别小看这几个字,对一线开发者来说,这比什么“空谈AGI潜力”“长上下文能力”有用多了。
我们去年年末还在用GPT-4写业务代码,但GPT-4很贵,还老出错。算下来,光调Prompt就累得半死。
转了Claude Code之后,几个好处直接立马显现出来:
稳定性强:代码规范,逻辑清晰,跑生产环境完全够用。
灵活选择:复杂逻辑用Opus,日常开发用Sonnet,自由切换。
速度快:我们自测,同样的需求,Claude比GPT-4快不止一星半点。
可控性高:用Claude Code可以审逻辑、加前缀,代码安全性远远强于黑盒模型。
有开发者在推特上直接说:“用Claude,意味着我可以不看OpenAI脸色,模型太强了我还能按住它。”
不止是写代码,Claude玩的是真家伙。
讲个真事。
Mythos 5.0刚内部测试时,安全研究员Nicholas Carlini在旧金山unprompted大会上做了个演示。他给Claude搭了个脚手架,用CTF风格任务提示,让它去挖Ghost CMS的漏洞。结果90分钟内,Claude不仅找到了盲SQL注入,还直接读出了管理员API密钥和密码哈希,这套系统可是在GitHub上有5万颗星的流行框架。
同样的演示里,Claude还在Linux内核NFSv4守护程序里发现了一堆堆栈/堆缓冲区溢出漏洞,而且能远程利用。这漏洞从2003年就存在,20多年没人发现,被AI给挖出来了。
后来换成其他模型,同样的任务,逻辑走到一半就断了,不是插件报错,就是理解不了复杂上下文。
你说这是不是模型差距?是,是底层能力不一样。
这一代Claude的底子,明显更偏向于实战:
代码理解能力强
安全审计底子厚
漏洞挖掘、内核开发、自动化测试相关的场景多
Anthropic迭代快、文档清楚,开发者好上手
别说“未来AGI”,就说现在的本事:我们要的是挖漏洞、写代码、可控运行,这些Claude都做到了。
实战是练出来的,Claude的代码能力没人能抄。
很多人说AI圈子热闹、大模型内卷,但真本事不能全靠吹,尤其是那种危险的真本事。
比如Mythos 5.0,它是当前Opus和下一代模型里的顶配,模拟黑客攻击,并不是靠发布会吹出来的。它体量比Opus更大、更智能,也更昂贵,内部训练早就结束了,但Anthropic不敢公开发布,就是因为它太危险,怕被黑客拿去搞大规模网络攻击。
Claude在安全测试里几乎全线碾压了其他模型,拿下实战冠军。
这就不是靠“营销”吹出来的,而是靠真刀真枪挖出的漏洞。
在最新的内部评估中,Claude发现了从Web应用到系统内核的多类零日漏洞,覆盖SQL注入、缓冲区溢出,是业界里最深、最狠的一套,足以见得整体实力有多强。
一个值得被重视且已经被重视的AI。
这几年Claude已经走过“有没有”“够不够强”“能不能用”的阶段,今天这个热明天那个火,一堆模型炒过,真正的问题是:有没有一个能挖洞、能写码、能可控运行的AI?
你可能还在惊叹GPT-4多么惊艳,但我告诉你:黑客不会等OpenAI更新。
他们现在要的,是一套能发现零日、能自动利用、能大规模攻击的“武器”。
Mythos 5.0泄露那天,很多安全专家在评论区只留了一句话:
“这东西太危险了,千万别落到坏人手里。”
在Anthropic内部,一批工程师已经默认它是“标配”,Boris Cherny说自从2025年11月以来他就没手动改过代码,每天能提交10到30个PR,全靠Claude Code生成;在安全圈,越来越多白帽子和黑帽子把它当成了实战工具。