100万行代码,造了个“浏览器”?
AI 编程公司 Cursor 最近放了个大招。
他们声称,让数百个 AI 代理连续运行一周,从零开始造了一个浏览器。
代码量超过 100万行,文件多达 1000个。
听起来是不是很震撼?
但等等,这个“浏览器”……真的能跑起来吗?
皇帝的新浏览器
Cursor 在一篇名为《Scaling long-running autonomous coding》的博客里,详细描述了这次“伟大”的实验。
他们的目标很宏大:探索 AI 代理在通常需要人类团队数月才能完成的项目上,能走多远。
实验的高潮,就是那个“从零构建的浏览器”。
博客里充满了各种激动人心的描述:“解决了大部分协调问题”、“新代理仍能理解并取得有意义的进展”、“数百个代理并发运行,冲突极小”。
但通篇读完,你会发现一个奇怪的现象。
他们从未明确说这个浏览器成功了。
它真的能运行吗?没人知道。
编译失败,代码“垃圾”
好奇心驱使下,有人去 Cursor 公开的 GitHub 仓库里一探究竟。
结果令人大跌眼镜。
error: could not compile 'fastrender' (lib) due to 34 previous errors; 94 warnings emitted
编译直接失败。
更离谱的是,有人回溯了最近 100 次代码提交,一次都没能成功编译过。
GitHub Actions 的持续集成(CI)也一直报错,甚至最近的合并请求(PR)都是在 CI 失败的状态下被合并的。
这算什么“有意义的进展”?
一位开发者直言不讳:这根本不是工程代码,而是典型的 “AI 垃圾”。
一堆看起来像代码的东西,但没有设计意图,连最基本的编译都通不过。
精妙的文字游戏
Cursor 真的撒谎了吗?
好像也没有。
他们从头到尾,都没说“这个浏览器能用了”。
他们只是展示了一个视频截图,然后说:“虽然看起来可能只是个简单的截图,但从零开始构建一个浏览器是极其困难的。”
这种暗示,堪称语言的艺术。
他们成功营造了一种“我们搞成了大事”的氛围,但又巧妙地避开了所有可以被证伪的承诺。
没有可复现的演示,没有可验证的版本,没有运行指南。
只有一个充满了编译错误的代码库。
奇怪的乐观结论
最让人玩味的,是文章的结尾。
但核心问题——我们能否通过投入更多代理来扩展自主编码——的答案比我们预期的要乐观。
这结论是怎么得出的?
到目前为止,他们只证明了一件事:AI 代理可以输出数百万行代码,然后造出一个根本跑不起来的东西。
这也能叫“乐观”?
一个实验性的浏览器,不需要对标 Chrome。
但最起码的门槛应该是:能编译,能渲染一个简单的 HTML 文件吧?
Cursor 的实验,连这个门槛都没摸到。
当 AI 的炫技变成一场无法验证的“行为艺术”,我们到底该相信什么?