美国一位联邦法官近日就人工智能企业在训练系统时使用受版权保护内容的问题作出了一项具有里程碑意义的裁决,此案或将重塑整个AI行业的数据使用规则。被告方为Claude AI助手的开发商Anthropic,这也是美国法院首 次直接就生成式AI背景下的“合理使用”问题作出判决。
法院裁定:AI训练属“合理使用”,但盗版存储违规
美国地方法官威廉·阿尔苏普(William Alsup)于本周一裁定,Anthropic在训练其大语言模型(LLM)Claude时使用受版权保护的书籍,属于“合理使用”范畴,因其过程“极具转化性”。阿尔苏普将AI的训练类比为“作家通过阅读学习写作的过程”。
他写道:“就像任何渴望成为作家的读者一样,Anthropic的语言模型并非为了抄袭或取代原作,而是为了创造出完全不同的内容。”
这与Anthropic的辩护观点一致:其AI系统“学习了原告作品中的写作风格,从中提取出不受版权保护的信息,用于推动科技进步”,并强调这种学习方式是版权法所鼓励的,有利于激发人类创造力。
然而,法官也划定了“红线”——Anthropic非法存储大量盗版书籍的行为并不受“合理使用”保护。
超 700 万本盗版书惹祸,“中央图书馆”成争议焦点
问题出在Anthropic所谓的“中央图书馆”上。据悉,公司存储了超过 700 万本盗版图书副本,部分并未被用于AI训练。阿尔苏普质疑:“在可以合法购买或获得内容的前提下,为何还要从盗版网站下载?”他明确否定了Anthropic“数据来源无关紧要”的说法。
因此,尽管训练方式被认定为合法,Anthropic仍将因盗版书的存储行为,在今年 12 月出庭接受关于版权损害赔偿的审判。若被判“蓄意侵权”,单本书籍的法定赔偿最 高可达 15 万美元,公司面临巨额赔偿风险。
影响波及整个AI行业,合理使用界限需厘清
该判决意义重大。当前,OpenAI、Meta、微软等多家科技巨头也因类似问题陷入版权诉讼风暴。此次裁定可谓“几家欢喜几家忧”——AI公司可庆幸训练过程获合法认定,版权方则可据此追究“数据来源”是否合法。
Anthropic方面对结果表示满意,其发言人称:“我们很高兴法院认可了我们的AI训练方式具有变革性,并符合版权制度促进创造与科技进步的宗旨。”
不过,该案也敲响警钟——AI企业不能再把“随手抓数据”当作理所当然。法官强调:“可以合法获得的数据,不应以最方便的方式非法获取。”
结语:AI企业“拷贝”行为将受严格审视
随着AI技术的快速发展,法院正逐步明确界限:创新不等于任意复制,合理使用也有条件限制。未来,AI公司在使用内容时必须更加审慎,不仅要考虑如何“用得好”,更要考虑“取得合法”。
这起案件虽是个别裁定,但其对行业的示范效应已不可小觑——从数据的获取方式到版权的边界理解,都将成为AI行业不可回避的“合规必修课”。
(举报)