炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!
(来源:AIX财经)
AIX财经(AIXcaijing)原创
见习作者 | 雷晶
编辑 | 金玙璠
近日,美国AI公司Anthropic发布报告,公开指控中国三家大模型公司深度求索(DeepSeek)、月之暗面(Moonshot)与稀宇科技(MiniMax)对其Claude模型进行了“工业规模的蒸馏攻击”。这一指控迅速在全球AI行业引发了广泛的讨论与争议。
值得注意的是,Anthropic自身也面临过数据合规方面的争议。其曾在2025年9月因使用盗版书训练模型而与作家群体达成高额和解,并在今年年初因音乐版权问题面临来自音乐出版商的诉讼升级。在这样的背景下,其高调指控他人,使得这场风波的动机与合理性变得更加复杂。
此次事件的核心,是一种被称为“模型蒸馏”(Model Distillation)的AI训练技术。其原理可以通俗地理解为“老师教学生”:一个能力更强的大模型(老师)通过输出带有推理过程的示例,来训练一个参数量更小的模型(学生),从而以更低的成本实现知识的迁移和能力的复刻。在行业普遍观点中,这是一种常规且公认的模型能力提升方式。
技术本身是中立的,但行业内对于模型蒸馏是否构成侵权并无统一的法律规范。相关的争议往往涉及服务协议的违约问题,而非明确的法律禁止条款,这导致侵权行为难以界定,证据也难以获取。
更值得玩味的是,Anthropic此次为了证明其指控,详细披露了其监控和识别API调用模式的能力。这变相承认了其具备对用户调用行为的深度洞察力,无形中加剧了业界对于AI时代数据隐私和用户安全的普遍担忧。
一项行业通用技术被“武器化”,这场“蒸馏闹剧”究竟是在维护权益,还是在掩盖竞争焦虑?回到事件本身,模型蒸馏的合规边界究竟在哪,或许才是更值得深究的问题。
要理解整场争议,首先必须厘清“模型蒸馏”这一核心技术概念。
这是一种知识迁移(Knowledge Transfer)的方法。前大厂AI技术人员Frank打了个比方,就像老师读了1000万本书,过滤掉500万本,只留下精华的部分。学生可以直接学习这些精华,“脑容量”可以变小,但能力却能接近老师。其本质是实现模型能力的高效传递与复用。
需要明确区分的是,模型蒸馏与备受质疑的“套壳”有着本质的差别。北京理工大学博士生王明解释,“套壳”是简单地调用第三方模型的API接口或者原封不动移植开源模型,然后包装上自己的产品外壳;而模型蒸馏是一个完整的训练与优化过程,最终生成一个全新、独立的模型。
模型蒸馏最早在2015年被提出,最初主要应用于图像分类和语音识别等场景。随着大模型时代的到来,“模型蒸馏已成为行业常态,即使是海外头部模型厂商也会学习对方模型的优势能力”,AI创业者Jojo告诉「AIX财经」。
模型蒸馏之所以在业内被广泛采用,原因在于降本增效。
从零开始训练一个高性能的大模型,需要耗费海量的高质量数据、巨大的算力以及漫长的研发周期,成本极其高昂。
通过蒸馏,AI企业首先降低了数据成本:利用成熟模型的API生成高质量的“问答”作为训练数据,大幅减少人工标注和数据清洗的成本;其次加速了研发进程:快速让自身模型的能力向行业头部模型看齐,缩短技术差距,更快地验证产品和商业模式。
然而,为了防止自身核心能力被轻易“蒸馏”,闭源模型厂商也在采取防范措施。王明提到,Anthropic已经声明,一旦识别到用户在进行模型蒸馏,可能会对输出语料进行“投毒”,也就是在正常语句中混入错误标点、打乱文字顺序、植入隐性错误等,迫使蒸馏方投入大量人力校对、清洗数据,以此变相提高蒸馏成本。但这同样可能损害自身模型的声誉和用户体验。
模型蒸馏的技术中立性与商业应用的复杂性,自然引出了下一个核心问题:在法律层面,这些行为该如何界定?
Anthropic此次并未提起正式诉讼,而是选择发布公开报告并呼吁行业与政策制定者采取行动。
它的指控很具体:注册大量虚假账号、绕过地域限制、进行“工业规模的蒸馏攻击”。在理解这个指控之前,先弄清一个技术细节,模型蒸馏有两种形态——“黑盒蒸馏”与“白盒蒸馏”。
北京星也律师事务所于泽辉律师介绍,“白盒蒸馏”是需要获取模型的内部权限,直接访问底层参数、权重和架构。“黑盒蒸馏”则是只能通过API接口与模型进行交互。
Anthropic指控的是“黑盒蒸馏”,而这种做法在学术界和产业界被视为正常的技术迭代手段,不涉及任何商业机密的摄取。于泽辉解释,这就像一个学生阅读教材,并不侵犯教材的版权。
我们从证据链、版权归属和不正当竞争三个核心维度,结合法律专业人士的观点进行分析。
根据法律从业者的观点,Anthropic指控面临的首要挑战是证据链的完整性。
剑桥颐华律师事务所杨卫薪律师告诉「AIX财经」,即便Anthropic能证明特定账号存在高频调用,却无法证明这些调用产生的输出内容确实被用于模型训练,更无法证明相关行为是为所在公司的产品开发服务。这之间隔着多层需要独立证明的法律事实。Anthropic目前公开的信息,并未完成这一系列的举证环节。
其次,指控若要构成版权侵权,需证明其模型输出的内容是受《著作权法》保护的“作品”。这面临两大障碍:
一是AI生成物是否构成作品?于泽辉提到,美国版权局通常对纯AI生成内容不予版权保护。但Anthropic的用户协议中明确约定,用户拥有对输入和输出内容的权利。他指出:“平台既然已经通过协议将相关内容的所有权转让给用户,随后又主张知识产权受到侵害并限制用户合法使用,这在法律逻辑上是完全自相矛盾的。”
二是保护思想还是表达?杨卫薪介绍,AI大模型通过交互学到的是能力而非具体内容,这种能力属于思想、方法的范畴,而著作权法仅保护表达,并不保护思想和概念,因此相关行为并不构成版权侵权。
最后,将“模型蒸馏”定义为不正当竞争行为同样困难重重。
于泽辉表示,Anthropic在这一问题上存在将违约行为与违法行为相混淆的倾向。它将用户协议层面的违约指控,包装成非法提取甚至国家安全威胁,而这在法律层面是两个性质不同的概念。
Anthropic用户协议中存在“禁止用于训练竞争性模型”的条款,一方面,“竞争性模型”的定义模糊不清。另一方面,即便相关企业违反了禁止将模型输出用于竞争模型训练的用户协议,其承担的主要是合同法上的违约责任,但这并不等同于实施了不正当竞争行为。通过正常且付费的API调用获取公开输出,是否构成入侵系统获取底层代码或参数,值得商榷。
综上所述,受访律师认为,Anthropic的指控在现行法律框架下,无论是从版权还是不正当竞争的角度,都面临着相当大的举证困难和法律适用障碍。Anthropic选择发布公开报告而非提起正式诉讼,或许与上述法律层面的挑战不无关系。
尽管在法律上难以被严格界定为“窃取”,但模型蒸馏在商业战略层面无疑是一把双刃剑。它为AI领域的追赶者提供了一条看似高效的“捷径”,但也带了局限和挑战。
首先是能力天花板和创新能力受限。学生模型的能力上限被教师模型牢牢锁住,它能学会老师教的知识,却很难超越老师,更无法实现真正的源头创新。
Frank告诉「AIX财经」,蒸馏后的模型大多会做轻量化处理,虽然参数更少、算力需求更低,但在处理复杂、全新任务时也会表现不佳,甚至出现输出不稳定的情况,能力天花板有限。
他进一步解释,如果原模型的思维偏理性,类似于“数学老师”,蒸馏后的模型也会延续这一特点,在语文等其他领域的能力可能会相对薄弱。
过度依赖蒸馏也会使模型在回答风格和思维范式上趋同于教师模型,丧失独特性和创造性,难以形成差异化的竞争优势。
其次是缺陷被继承。Frank表示,教师模型存在的偏见、幻觉、错误认知等问题,会被蒸馏后的模型原样继承,且由于学生模型不具备自主纠错的能力,这些缺陷会被固化甚至放大。
这些局限指向一个核心问题:靠模型蒸馏,企业无法实现技术上的超越,所以对于处于追赶阶段的企业而言,这只是一种务实的阶段性策略。
王明解释,模型训练分为预训练、后训练等多个阶段,最核心的预训练阶段无法通过蒸馏完成,企业要自主研发模型,就必须独立完成这一阶段。同时,企业在不同发展阶段对数据的需求也不同,起步阶段会用蒸馏数据控制成本、快速验证技术可行性,但发展到追求模型质量的阶段,必然会转向人工创造的高质量数据,打造自身模型的独特性。
Jojo指出,蒸馏的核心作用是让后发模型快速向先进模型对齐。这是“追赶者”的技术手段,但单纯依靠这份复刻的能力,企业只能一直跟在头部厂商身后,后续的研发工作也容易陷入被动的跟随状态,无法突破原模型的能力边界,更谈不上打造属于自己的技术壁垒。
在Frank看来,在AI快速发展的时代,想要靠限制蒸馏来维持竞争优势并不现实,与其将精力放在对现有能力的保护上,不如多花功夫在自身模型的技术迭代和创新上,实现突破。
总的来说,不必谈“蒸馏”色变。模型蒸馏仅是一种普遍、常规的技术迭代手段,它能为AI模型的发展提供一把“梯子”,但并不是“万能药”,模型的优势还要靠自身的核心研发实力来实现。
本质上,Anthropic的指控,是全球AI产业在高速发展下一次矛盾的集中爆发。它反应出了一些值得深思的问题:
一是开源与闭源的路线之争:事件背后是AI领域开源精神与闭源商业模式之间的持续博弈。如何在鼓励技术快速扩散、推动行业整体进步与保护企业研发投入、维持商业竞争力之间找到平衡,是所有从业者必须面对的难题。
二是全球AI竞争的白热化:随着中国AI企业的快速崛起,全球AI领域的竞争正日趋激烈。Anthropic的指控,无论其初衷如何,客观上都带有浓厚的商业竞争色彩,反映出头部厂商在领先地位受到挑战时的焦虑。
对于被指控的企业而言,此次风波是一次警醒,提示我们在追赶过程中必须更加注重合规性,并尽快从“学习模仿”走向“自主创新”。而对于整个行业,与其将精力耗费在如何限制“蒸馏”上,不如回归技术创新的本质,通过构建真正的技术壁垒和差异化优势,来赢得市场的最终尊重。
*题图及文中配图来源于pexels。应受访者要求,文中Frank、Jojo、王明均为化名。