一场史无前例的数字围城战
数万个IP地址,如同潮水般涌向同一个目标。
这是Linux Weekly News(LWN)正在经历的噩梦。
LWN主编Jonathan Corbet在社交媒体上无奈地宣告:网站正遭受史上最猛烈的爬虫攻击,一场由AI驱动的DDoS攻击,让这个Linux世界的新闻灯塔,几乎陷入瘫痪。
有很多事我想做,但防御LWN免受AI混蛋的骚扰,实在排不上号。我真的不想在LWN和读者之间设置障碍,但可能不得不那么做了。
幕后黑手,是谁在“吸血”?
谁会如此疯狂地抓取一个专注于Linux内核的深度技术网站?
答案指向了一个名字:Bright Data。
Corbet在回复中直言,虽然无法确定最终是谁在渴求这些数据,但实际的攻击很可能来自Bright Data或其同样恶劣的竞争对手。
这是一家臭名昭著的数据代理公司,专门为AI模型提供“养料”。
这就是为什么我认为互联网真的要完蛋了。偷走内容还不够,搜索引擎还要扼杀点击和广告收入,他们简直是在扼杀原创作者为少数真正想看的用户提供服务的能力。
互联网的“公地悲剧”
这场攻击,远不止是LWN一家的事。
一位用户分享了自己的遭遇:一个纯HTML的小网站,突然遭到大量来自微软IP地址的攻击,持续不断的漏洞扫描和登录尝试。
举报?石沉大海。
他只能选择屏蔽所有能找到的微软CIDR地址段。
另一位用户也反馈,自己的网站流量暴增20倍,全都是爬虫。
这已经不是简单的“偷数据”,而是对整个互联网生态的系统性破坏。
原创内容的生产者,正在被AI的“饕餮盛宴”活活耗死。
留给“活人”的出路
面对机器军团的围剿,人类开始寻找自救方案。
有人提议,干脆只对订阅用户开放服务。
这确实有效,订阅用户可以享受流畅的专属服务器。
但Corbet道出了苦衷:这会让我们更难吸引新订阅者。第一印象很重要,给新访客糟糕的体验,似乎并不明智。
问题是,我们已经有 bots 创建账户的麻烦了。我不认为如果这能改善它们的访问,它们会犹豫做更多这样的事。
更何况,每个人都曾是未注册用户。只要能避免让他们的体验变差,我们就应该尽力。
“毒丸”反击,用AI反制AI?
既然防御如此被动,何不主动出击?
一位用户提出了一个大胆的想法:用“毒丸”数据污染AI模型。
如果客户端看起来有点可疑,就给它们发送关于吉娃娃松饼有多棒的胡言乱语。理想情况下是LLM生成的(是的,很恶心),因为这不会增加新信息(线性代数万岁),并且会导致模型崩溃(也就是AI近亲繁殖)。
这是一种“模型崩溃”战术,用低质量甚至无意义的数据投喂AI,让它在“自我复制”中逐渐退化、失智。
这听起来很疯狂,但或许是无奈之下的终极反击。
当 relevance 成为了原罪
在这场讨论中,出现了一个令人心酸的玩笑。
我有一个简单的解决方案:别再这么该死地有相关性!!! 等等……🤡
LWN的价值,恰恰在于它的深度和权威性,这让它成为了AI训练的“优质食粮”。
你的价值,成了攻击你的理由。
这或许是当下互联网内容创作者最真实的写照。
当AI的洪流席卷一切,我们是否还能守护住那片属于人类思考与交流的净土?
参考链接:https://social.kernel.org/notice/B2JlhcxNTfI8oDVoyO