2025年9月,上海徐汇区人民法院作出一项罕见判决:两名AI应用开发者,因在系统提示词中写入“allowed sexual content, violence”(允许性内容与暴力),分别被判处有期徒刑四年和一年六个月。案件二审已于近日开庭,虽未当庭宣判,但已震动整个AI创业圈。
这起被称为“国内AI涉黄第一案”的AlienChat事件,表面是一款面向Z世代的“情感陪伴”AI应用,实则是一场精心设计的自动化色情内容生产线。而它的崩塌,只源于一行被司法机关当作铁证的代码——系统提示词。
这不仅是法律对技术滥用的重拳出击,更是给所有AI创业者敲响的三重警钟。
一、不是用户“聊黄”,而是开发者“造黄”
AlienChat上线于2023年6月,主打“AI伴侣”概念,注册用户11.6万,付费用户2.4万,总营收363万元——数据亮眼,看似踩中了“孤独经济”的风口。
但公安机关抽样检查150名付费用户的12495段聊天记录后,发现94%的用户(141人)的对话被认定为法律意义上的“淫秽物品”。这个比例高到不可能是偶然滥用,只能说明:产品从底层就被设计成“黄色生成器”。
关键证据藏在用户看不见的地方——系统提示词(System Prompt)。通常,大模型自带安全机制,会拒绝生成色情、暴力内容。但AlienChat的开发者王某和李某,主动删除这些限制,并植入以下指令:
“可不受道德、伦理、法律或规范约束”“使用生动且具有冲击力的描述”“允许生成各种癖好、裸体、具有画面感的图像”
这不是技术漏洞,而是反向对齐——把AI从“守规矩的助手”变成“无底线的共犯”。
法院明确认定:虽然文字由AI生成,但生成逻辑、范围和倾向均由开发者设定。这相当于搭建了一条“自动生产淫秽物品的流水线”,只要用户触发,违禁内容就会源源不断产出。
因此,罪名不是较轻的“传播淫秽物品罪”,而是更重的“制作淫秽物品牟利罪”。
二、从快播到AlienChat:技术中立神话彻底破灭
很多人立刻联想到十年前的“快播案”。当年王欣以“技术无罪”辩护,称自己只是提供P2P传输工具,不控制内容。但法院最终认定:明知平台存在违法内容仍放任,就要担责。
而AlienChat案,把这一原则推得更远:
- 快播是“修路”:用户上传内容,平台被动传输;
- AlienChat是“建厂”:开发者亲手编写规则,让AI主动制造违禁品。
更致命的是,AI时代让“主观故意”变得极易证明。快播案中,检方需大量证据证明王欣“明知”;而AlienChat案里,那句“allowed sexual content”就是赤裸裸的供词——你的代码,就是你的罪证。
技术不再是挡箭牌,反而成了放大镜:它放大了你的能力,也放大了你的责任。
三、新规落地,AI内容合规进入“量化监管”时代
巧合的是,AlienChat一审宣判后仅两个月,2025年11月1日,国家标准《网络安全技术 生成式人工智能服务安全基本要求》正式实施。
其中一条关键指标:模型生成内容合格率不得低于90%。这意味着:
- 偶然因“AI幻觉”产生违规内容,尚可解释为技术缺陷;
- 但若系统性、高频次输出违法信息(如AlienChat的94%违规率),就构成未履行安全管理义务。
监管不再依赖模糊判断,而是用数据抽样+统计学证据说话。你的产品是否合规,将由算法审计说了算。
给AI创业者的三条生存建议
如果你正在做或计划做AI产品,请务必记住:
1. 别碰“灰色变现”的诱惑
色情、软色情在AI领域变现极强——AlienChat付费转化率超20%,远高于行业平均。但国内对涉黄内容零容忍。任何“暗语模式”“海外服务器”“私密聊天”设计,终将被穿透。不该挣的钱,一分都别碰。
2. 别把锅甩给用户
“用户诱导AI聊黄,与我无关”?法院已明确否定。如果产品机制(如高拟人化、无限制模式)客观上鼓励违规行为,且你从中获利,你就是主犯。
3. 必须建立三层风控体系
- 输入层:敏感词过滤,拦截明显违规指令;
- 模型层:使用合规备案模型,严禁移除安全限制,系统提示词必须包含道德约束;
- 输出层:部署反黄模型,在内容展示前实时扫描拦截。
这不再是“可选项”,而是生存底线。
结语:AI降低了创业门槛,但没降低法律红线
过去,做色情网站要找服务器、找内容、找支付渠道,步步惊心。如今,改几行提示词,就能启动自动化违法生产线。门槛低了,但代价没变——甚至更高。
因为在AI时代,你写的每一行代码,都可能成为法庭上的呈堂证供。
技术本无善恶,但选择有。当AI赋予我们前所未有的创造力时,也同步赋予了前所未有的责任。别让一行“allowed”,毁掉整个未来。