作家诉AI模型侵犯版权,未证明损害,美国法院认定属于转换性使用

来源:知识产权创新与竞争研究中心CUPL 发布时间:2025-07-14

裁判要旨

2025年6月25日,美国加州北区联邦地区法院驳回原告(13位作家)的部分即决判决动议,支持Meta的部分即决判决动议。

法院认定Meta未经许可使用原告作品训练AI模型(Llama)的行为构成合理使用。但法院同时强调,此案仅针对这13位原告,不代表Meta使用所有受版权保护的作品训练AI均合法。

(编者注:即决判决是指在英美法系国家中,当案件不存在事实争议仅涉及法律问题时,法院不经开庭审理,根据双方提供的证据直接作出的判决。)

 

Part1 基本案情

 01 诉讼双方

原告:Richard Kadrey等13位主要以小说创作为主的作家,对案涉图书享有版权。

被告:Meta公司,其开发了名为“Llama”的大型语言模型(LLM),Llama是一种生成式AI模型,它通过分析训练数据中词语和标点(tokens)的关系学习语言,并据此预测生成新文本。

 02 基本事实

对于大型语言模型来说,输入训练数据的质量越高,输出的文本质量越高,大多数书籍篇幅较长、结构连贯且特色鲜明,是一种非常有价值的训练数据。

最初,被告Meta公司希望获得授权以使用书籍,并尝试与出版商谈判授权协议,但因授权过程十分复杂,被告开始通过“影子图书馆”下载至少666本原告拥版权的书籍及其他文本并用作训练材料。

(编者注:影子图书馆是一种提供书籍、学术期刊文章等资源的在线储存文库,这些资源无论是否受版权保护均可供用户免费下载,其包括LibGen、Z-Library等数据库。)

此外,被告采用种子文件下载技术(Torrenting)以提高大型数据集的下载速率,其原理是用户可以从已拥有该文件部分内容的其他用户那里同时获取不同片段,再将这些片段组合成完整文件,下载的同时(或下载完成后),用户也可以向其他用户上传自己已经获取的部分。

同时,被告也采取了措施防止模型“记忆”并输出受版权保护的内容。对此,双方专家均测试证实Llama模型无法生成超过50个词语和标点的内容,且无法再现“显著比例”内容(即无法复现作品的“实质性部分”)。

原告认为Meta的行为不能被视为合理使用,而Meta则辩称其行为应被视为法律上的合理使用。双方就“合理使用”问题提出交叉即决判决动议。

关于原告声称Meta通过种子文件下载技术分发其作品构成侵权,双方均未提出即决判决动议,是本案中一个悬而未决的问题,法院将于2025年7月11日进行审理。

 

Part 2 争议焦点

Meta未经原告许可,使用原告书籍训练Llama的行为是否构成合理使用?

 

Part 3 法院推理

 

美国《版权法》第107条规定:判断某一使用行为是否属于合理使用需要考虑四个因素:

1.使用的目的和性质:包括该使用是否具有商业性质或用于非营利教育目的;

2.受版权保护的作品的性质;

3.与受版权保护的作品相比,所使用部分的数量和实质性;

4.使用对受版权保护作品的潜在市场或价值的影响。

法院基于上述四因素,对该案进行分析:

 

因素一:

使用目的和性质

1)原告主张Meta的使用不具备转换性:

法院认为,被告Meta使用书籍的目的与原告创作书籍的目的不同。Meta复制这些书籍的目的是训练语言模型,将模型作为创新工具来生成多样化的文本并执行多种功能,因此其使用行为具有高度的转换性。而原告创作书籍的目的是供人阅读以进行娱乐或教育,二者具有显著的差异。

2)原告主张Meta的使用仅仅是对他们的书籍进行了“重新包装”:

法院认为,原告提供的证据并不能证明Meta训练Llama是为了重新包装原告的作品。相反,双方专家均证实Llama最多只能生成50个词语和标点,且无法再现书籍的“显著比例”内容。原告提供的证据最多能够表明Meta希望Llama能够生成某些风格的文本,但风格是不受版权保护的,只有表达才受保护。

3)原告主张Meta从“影子图书馆”下载的是盗版书籍,因此Meta的行为不构成合理使用:

法院认为,原告的主张有误。合理使用的分析核心在于特定的复制行为是否违法,而非书籍的来源是否合法,因此原告的主张回避了问题的关键。

但Meta使用“影子图书馆”的行为也并非与其是否构成合理使用完全无关,首先,其使用行为与恶意问题相关,即与因素一“使用目的与性质”相关,但在本案中恶意不是判定合理使用的决定性因素。其次,如果Meta的使用行为助长了“影子图书馆”未经授权复制和传播受版权保护的作品的行为,那么就与因素四“使用对受版权保护作品的潜在市场或价值的影响”相关。因此其从“影子图书馆”下载书籍的行为虽非分析是否构成合理使用的决定性因素,但却是相关因素。

4)原告主张Meta下载原告书籍的行为与使用这些书籍训练Llama的行为,应被独立进行法律评价:

法院认为,虽然Meta的下载行为与在Llama训练过程中进行的复制行为不同,但这种下载仍需根据其最终、高度转换的目的来综合考量。由于Meta对原告书籍的最终使用具有转换性,因此Meta下载这些书籍的行为也具有转换性。

此外,法院认为,尽管Llama具有商业性质,未来可能为Meta带来数十亿美元的收入,但是商业性质并不是判断因素一的决定性因素,当二次使用具有高度转换性时,商业性质对判定因素一的影响会大大降低。

 

因素二:

受版权保护作品的性质

法院认为,原告的书籍主要是小说、回忆录和剧本,皆为具有高度表达性的作品,受版权法的重点保护。Meta对原告书籍的使用确实依赖于书籍的创造性表达(如单词和概念之间的统计关系就是一种创造性表达),但法院强调,这一因素在合理使用的判定中作用有限,尤其是被复制作品已经出版、二次使用者不会影响创作者对“发表权”的控制时,其重要程度会进一步降低,因此,尽管因素二对原告有利,但影响有限。

 

因素三:

与受版权保护的作品相比,

所使用部分的数量和实质性

该要素旨在判断使用部分的数量与实质性是否与复制的目的相称,故因素三与因素一具有关联性。

法院认为,由于Llama模型不会输出原告书籍的任何有意义的部分,其复制不太可能导致直接替代品的产生。即使Meta复制了原告的全部书籍,考虑到Meta的转换目的,其复制的量也是合理的。因为如果大语言模型接受更多高质量材料的训练,其表现会更好。

 

因素四:

使用对受版权保护作品的

潜在市场或价值的影响

因素四是判断合理使用的“最重要因素”,其核心是判断被告的使用是否会替代原作品,损害版权人的市场利益。

法院指出,在涉及使用受版权保护的作品训练生成式AI模型的案件中,原告至少可以通过三种理论来证明被告的复制行为损害了作品市场,以下为本案中法院对原告三种理论主张的回应:

1)原告主张该模型会重复其作品(或生成实质相似的作品),从而使用户能够通过该模型免费访问这些作品或其替代品:

法院认为,双方专家均证实Llama最多只能生成50个词语和标点,且无法再现原书籍任何有意义的内容,无法替代原作品。故该理论不成立。

2)原告主张未经授权的复制用于AI训练会损害AI训练授权市场:

法院认为,原告无权垄断“将书籍授权给AI训练”的市场,若允许版权人以此为由主张损害,会导致合理使用分析陷入循环——即任何未经授权的使用都可视为损害潜在授权市场。故该理论不成立。

3)原告简要提及AI生成作品将与原作品竞争,从而间接替代原作,稀释原书籍市场(市场稀释理论):

法院认为,法院必须根据当事人提出的论点和提交的证据来裁决案件。对于合理使用的积极抗辩方Meta公司提供了证据证明其复制行为未对市场造成损害,但原告未能提供任何相反的证据证明被告的复制行为已经对或者将来可能对市场造成损害,故该理论因缺乏实质性证据亦不成立。

 

Part 4 法院判决

批准Meta的部分即决判决动议,Meta未经许可使用原告受版权保护的书籍训练Llama的行为构成合理使用。

这项裁决后果有限,只影响本案13位作者的权利,不影响Meta用于训练模型的其他作品作者的权利。这一裁决也并不意味着Meta使用受版权保护的材料训练其语言模型是合法的,它仅仅表明本案中原告未能就最重要的原告作品市场被稀释的问题提出强有力的主张,亦未提交任何有意义的证据证明被告对原告利益造成的损害,使得其部分即决判决动议被法院驳回。

END

案件来源:Richard Kadrey, et.al v. Meta Platforms Inc.,案号:23-cv-03417-VC(北加州地区法院,2025年6月25日)

封面图片素材来源:https://pixabay.com/zh/illustrations/meta-logo-internet-business-6946715/