Anthropic 泄露背后：AI 安全承诺的破产与重构

AI 流量增速超人类 8 倍！流量「倒挂」前夜：AI 智能体正掏空互联网的旧金矿

2026 年 3 月 28 日

司美格鲁肽仿制药之争：国内超 20 家药企竞速，靠什么笑到最后？

2026 年 3 月 28 日

文 | 舒书

过去三天，Anthropic 新模型泄露的消息在科技圈持续发酵。

3000 份内部文件，因为一个 CMS 配置失误，暴露在互联网上。网络安全股集体暴跌，安全研究圈高度关注。

但比泄露本身更值得追问的，是另一件事：就在事发前一个月，Anthropic 刚刚修改了自己的《负责任扩展政策》（RSP 3.0）。那个曾让行业瞩目的「若风险不可控，就暂停训练」的硬条款，被删除了。

这不是一次简单的技术调整，它折射出 AI 行业正在经历的深层困境。

一、从硬刹车到软着陆：RSP 3.0 的变化

2023 年，当 Anthropic 推出 RSP 时，整个行业为之侧目。这是第一次，有 AI 公司公开承诺：如果模型太危险，我们就不做了。

当时的逻辑很清晰：设定危险阈值（比如可能助长生物武器研发），一旦触及，立刻暂停训练，直到安全措施到位。这是一条硬性约束，意味着安全优先级高于商业进度、融资节奏，甚至 IPO 窗口。

2026 年 2 月，RSP 3.0 发布。那条硬性约束消失了。

取而代之的是「前沿安全路线图、风险报告、外部审查」——每 3 到 6 个月发布一次报告，由内部专家起草，独立评审，提交董事会。官方解释是：「技术边界模糊，无法预设红线，所以转向透明披露。」

翻译过来就是：从做不到就不许动变成了边做边说。从硬刹车变成了软着陆。

首席科学家 Jared Kaplan 在接受采访时，直接道出了背后的逻辑：

「如果竞争对手飞速前进，我们单方面承诺暂停训练没有意义。」

这不是技术判断，是生存判断。对于一家估值 3800 亿美元、正被 OpenAI、Google、xAI 围剿的公司，继续自我设限在商业上意味着掉队。从硬刹车到透明监控，中间差的不是技术认知，是囚徒困境下的生存本能。

生存本能

二、军事博弈：当安全红线遭遇国家意志

如果说 RSP 3.0 的调整是主动妥协，那么军事领域的博弈，则是一场真正的底线考验。

Anthropic 曾公开承诺：「拒绝参与全自主武器和国内大规模监控。」

2026 年 2 月 24 日，美国国防部长皮特·赫格塞斯当面向 Anthropic CEO 达里奥·阿莫迪下达了最后通牒：解除 Claude 模型的所有军事用途限制（包括进攻性网络行动），否则将面临惩罚。截止时间是 2 月 27 日。

后果是什么？要么五角大楼动用《国防生产法》强制接管模型，要么将 Anthropic 列为供应链风险企业——这个标签通常用于敌对国家的公司，一旦贴上，Anthropic 将失去所有国防承包商的商业联系。

2 月 27 日，最后期限到来。阿莫迪未能及时与五角大楼敲定最终条款。截止时间刚过 14 分钟，赫格塞斯宣布谈判破裂，将 Anthropic 正式列为供应链风险。特朗普随后下令联邦机构停止使用 Anthropic 技术。

但故事没有在这里结束。

3 月 9 日，Anthropic 正式向加州联邦法院提起诉讼，指控美国政府的系列行动前所未有且不合法。3 月 26 日，加州北区联邦地区法院法官 Rita Lin 批准了 Anthropic 的初步禁制令申请，叫停了国防部的封杀令。法庭文件显示，Anthropic 提供了关键技术证据：其模型在部署于军方封闭环境后，公司本身无法远程控制——这一证据戳穿了五角大楼的安全风险指控。

Anthropic 守住了这条底线，至少在这一回合。

但问题依然存在：底线能守多久？法院的裁定只是初步禁制令，不是终局。五角大楼可以换一种方式再来。而 Anthropic 的客户名单里，依然有国防部的名字——那些作战规划和情报分析的合作，依然在继续。