IA:ANTHROPIC批评阿里巴巴的“对抗性蒸馏”是什么?

人工智能正在进入地缘政治对抗的新阶段。在半导体、数据中心和最新一代芯片的争夺之后,现在正是模型本身的利用加剧了紧张局势。

据彭博社报道,Anthropic 在一封信中声称,阿里巴巴在 2026 年 4 月至 6 月期间精心策划了一场基于近 25,000 个欺诈账户的活动,以便与克劳德产生 2880 万次互动。据这家美国公司称,其目标不是使用其对话助手,而是有条不紊地提取其功能,以训练竞争模型。在一封写给几位美国参议员和白宫的信中,Anthropic 将这次竞选活动描述为在工业规模上进行的“对抗性蒸馏”。

一项已成为国家安全主题的古老技术

蒸馏本身并不违法。多年来,它一直是经典的机器学习技术之一。

它的原理很简单。一个称为“教师”的大型模型用于训练第二个更紧凑的模型“学生”。它可以学习重现老师的行为,同时需要更少的内存、计算能力和推理成本。这种方法被整个行业用来在智能手机、嵌入式设备或低成本基础设施上部署模型。

在这种情况下,蒸馏代表了一种完全合法的优化工具。 “对抗性蒸馏”基于完全不同的逻辑。

希望训练模型的实验室不再使用自己的系统作为教师。他大量质疑竞争对手的模型,收集他的答案,构建它们,然后将它们重新注入到自己的训练过程中。

在这种情况下,克劳德就不愿意成为竞争模型的老师。

这种区别是至关重要的,因为 Anthropic 谴责的不是蒸馏技术本身,而是未经授权针对专有模型的使用,以重现其部分功能。

只需一小部分成本即可重现多年的研究成果

前沿模型的经济学解释了人类反应的毒力。

开发像克劳德这样的模型需要数十亿欧元的投资。这些实验室动用了数十万个 GPU、一些世界上最强大的计算基础设施以及数月的持续培训。除了这些成本之外,还包括与数据集、对齐、安全评估和研究团队相关的费用。

蒸馏有望显着减少这笔费用。

通过查询数百万个案例的现有模型,参与者可以恢复推理模式、解决问题的策略、对齐偏好,甚至是编程或自主代理等领域的专门行为。它不直接复制模型的权重,而是试图重现其可观察的行为。

对于美国实验室来说,这种方法相当于获取培训期间创造的部分价值,而无需进行相同的投资。经济不对称加剧了业界的担忧。

为什么 Anthropic 谈论工业运营

Anthropic 提出的数字说明了规模的变化。该公司提到近 25,000 个欺诈账户在三个月内产生了 2880 万次对话。据她说,这些要求主要针对克劳德更高级的能力,包括软件开发和代理推理。

此描述不再是 API 的简单滥用。 Anthropic 描述了一个自动化框架,可以绕过帐户限制,跨大量身份分发查询,并系统地收集模型响应。使用“工业规模”这一词汇将这些做法与网络间谍活动或大规模数据收集操作进行比较。

田纳西州共和党参议员比尔·哈格蒂和新泽西州民主党参议员安迪·金计划提出一项修正案,惩罚从事此类行为的公司。

学习从哪里停止,复制从哪里开始?

然而,此案提出了一个基本上仍悬而未决的法律问题。所有实验室都会评估竞争对手的模型。公共基准、性能比较或响应分析是人工智能研究中的常见做法。

困难在于定义评估过程何时成为工业再生产的尝试。请求数量?他们的自动化?追求的目标?数据由此构成?

目前没有法律框架明确回答这些问题,这个灰色地带解释了为什么 Anthropic 试图将辩论从合同领域转移到国家安全领域。如果蒸馏被视为一种战略威胁,而不是简单地违反 API 使用条款,那么它就会为经济制裁和政府干预打开大门。

网络安全的新领域

其后果也将是技术性的。实验室可能无法完全阻止蒸馏。另一方面,他们会设法让它变得更困难、更昂贵、更容易被发现。

这为人工智能应用网络安全开辟了新领域。

用户的行为检测、请求的动态限制、响应的数字指纹、实验室之间的信息共享甚至水印机制都是美国主要参与者已经探索的途径。

随着模型变得越来越有价值,它们的 API 也成为关键的基础设施。