当前位置:

首页典型案例著作权

慕尼黑法院裁定ChatGPT“记忆”歌词构成版权侵权

发布时间:2026-01-09 02:22 文章来源:中国保护知识产权网 阅读:

慕尼黑第一地区法院在一起由代表德国作曲家、作词家和音乐出版商的集体管理组织GEMA对OpenAI提起的诉讼中裁定,ChatGPT对训练数据的“记忆”行为以及其输出结果中对歌词的复制,构成了版权侵权。法院认定,此类行为不属于德国《版权法》第44条b款(该条款用于实施《数字单一市场版权及相关权指令》第4条)中所规定的“文本和数据挖掘”例外情形。需注意的是,本次诉讼仅针对ChatGPT模型4和4o(当前模型为5.1)。

背景概述

本案涉及OpenAI基于生成式预训练变换器大型语言模型开发出的知名人工智能聊天机器人ChatGPT对德国歌词的复制行为。这些歌词被用作训练数据的事实是没有争议的。双方的核心分歧在于ChatGPT的输出结果是否构成了未经授权的复制,那些被“记住”的歌词是否构成了德国《版权法》第16条(即《信息社会指令》第2条)中与侵权有关的“复制”行为,以及此类复制是否属于该法第44条b款所规定的涉及文本和数据挖掘的版权侵权例外情形。

正如法院所描述的那样,当“训练过程中的非特定参数不仅可从训练数据集中提取信息,而且在训练后还可将训练数据完全融入到指定的参数中”时,这种大型语言模型就已经发生了“记忆”。这意味着训练数据可能被包含在模型中,并能以相当高的准确性和可靠性被复制。通过测试大型语言模型是否能在无需进行在线搜索的情况下,对简单提示反复给出相同或基本相似的回应,即可以证明这种记忆的存在。

慕尼黑地区法院的裁决

慕尼黑法院认定,ChatGPT模型4和4o已“记忆”了有争议的歌词,从而使其“以一种可复制的形式包含于模型中并因此得到展现。

法官表示:“就版权层面上的复制而言,可以暂不考虑此类记忆的具体工作原理。无论被告是否提到过自己会保存或者为训练数据提供版权保护,亦或如被告所言,模型的参数反映的是其基于整个训练数据集(即代表人类语言及其语境多样性的所有词语或标记的关系和模式)所学到的东西,这些都是无关紧要的。这是因为关键在于,用作训练数据的歌词以一种可复制的形式被包含在模型中并因此得以体现出来,这一点才是决定性的。”

因此,复制歌词的输出结果被认为是对原创歌曲歌词部分的侵权,即使当事人已经作出了修改或只是进行了部分的复制。在一个实际案例中,当事人仅复制原创歌词中的15个词就被认定为构成了侵权。

对于聊天机器人因所谓“幻象”而修改歌词的情况,法院认为这属于德国《版权法》第23条意义上的改编。虽然法院未对复制和改编行为进行明确区分,但其指出每一个改编行为必然会包含一项复制行为。

与此同时,法院还认定,通过使公众能够从其选择的地点和时间点上获取作品,这些作品已经构成了德国《版权法》第19条a款(《信息社会指令》第3条第1款)意义上的“向公众提供”。

OpenAI提出的抗辩理由均未获支持

“罕见漏洞”抗辩失败:OpenAI提出的抗辩理由之一是“训练数据的复制是一个罕见的漏洞,我们正在持续努力解决”。法院认为,侵权输出的示例表明,这些复制不太可能是偶然发生的。法院认定,即使在模型中存在人为的随机化,这些大型语言模型仍会“一致地、以最小差异复制被记忆的内容”,因为“在生成被记忆的内容时,构成该记忆内容的标记概率达到了非常高的数值,通常接近100%。”

无法通过文本和数据挖掘例外免除侵权责任:OpenAI进一步辩称,模型对歌词的训练和记忆属于德国《版权法》第44条b款(《数字单一市场版权及相关权指令》第4条)规定的有关版权侵权的一般性“文本和数据挖掘”例外情形。然而,慕尼黑法院认为该例外情形的适用条件并未得到满足,并得出结论认为,此类记忆并不服务于任何持续的“挖掘”功能,其等同于复制品留存在已训练的模型中。参照汉堡地区法院的LAION案判决结果,该法院区分了考虑侵权和可能适用文本和数据挖掘例外时需审视的三个连续阶段:创建训练数据材料,即提取训练材料并将其转换为机器可读格式;模型训练,即分析数据材料并用元信息对其进行增强;通过提示和输出对已训练模型进行后续使用。法院认为,德国《版权法》第44条b款的例外规定(及其在欧盟法上的依据,即《数字单一市场版权及相关权指令》第4条)适用于训练人工智能时的文本和数据挖掘。因此,为“准备”训练语料库而实施的复制行为属于其范围。但是,法院认定,涉案歌词在人工智能模型内的复制并不构成该条款中的文本和数据挖掘行为,因为训练数据(歌词)不仅仅是经历了分析程序,而是“被完整地复制到模型的参数中”。用于文本和数据挖掘的复制行为不会损害作者对其作品的使用权益,因为其提取的仅仅是信息,作品本身并未被复制。相比之下,模型内的复制则会实质性地损害作品,从而侵犯到权利人的合法权益。法院进一步阐述,根据《数字单一市场版权及相关权指令》的序言(特别是第3、第8和第18条中的内容)引入文本和数据挖掘例外不仅是为了促进创新和新技术,同时也旨在保护作者。换言之,第44条b款(以及《数字单一市场版权及相关权指令》第4条)只能为创建训练数据集(上述第1阶段)提供正当性依据,而不能为模型本身的训练(第2阶段)提供依据,也不能为第3阶段提供依据,不过法院未具体说明最后一点。

关于权利人已同意使用作品的指控亦未成立:法院认为,侵权行为并未获得授权同意。当事双方对于“那些可以从互联网上获取的歌词是否是在获得权利人同意的情况下被提供给被告的”这件事存在着争议。GEMA坚持主张他们已明确保留其作品权利并提出了“退出声明”。尽管法院未对此问题作出明确裁定,但其指出模型训练阶段不能被视为一种权利人可以合理预期到的“惯常且可预见”的使用方式。此外,即便假设已经获得了同意,这也不太符合德国《版权法》第44条b款所规定的例外情形,因为该条款仅允许为实现文本和数据挖掘目的而进行复制,并未延伸至超出此范围的其他复制行为。

引用与仿作例外抗辩均不适用: 法院亦未采纳其他版权例外规定。法院认为,输出内容不符合德国《版权法》第51条规定的引用例外,因为模型在架构上就无法实现这种引用目的。欧盟法院将引用的意义描述为解释陈述,为某种观点辩护或促使用户的陈述内容与作品之间进行智力层面上的互动。法院指出,无法确定模型具备这种意图(即出于引用目的的主观因素)。基于类似推理,法院认为输出内容亦不适用德国《版权法》第51条a款规定的仿作例外。该条款要求使用行为须出于仿作之目的。因此,需存在对既有作品或其他参照点的艺术性互动。这种互动对于模型而言是不可能的,因为它们缺乏能够利用受保护元素进行艺术性表达的任何人格要素。法院认为,用于生成输出内容的简单提示本身也不具有任何艺术性内容。

OpenAI关于ChatGPT用户应承担责任的指控不成立:法院认为,导致侵权输出内容的提示词极为简单,且未规定出任何具体内容。鉴于这种开放式的提示,输出内容中的任何版权侵权行为均不能归责于用户。由于OpenAI对其模型的架构和内容负责,且这些内容是在简单提示的触发下被复制再现的,OpenAI应承担直接责任,而非仅像托管平台运营商及软硬件提供商那样承担间接责任。法院明确指出,仅通过输入简单提示来触发复制行为,并不会使用户成为实施复制行为的主体。

其他抗辩理由:被告围绕非营利研究机构豁免、禁令措施的相称性以及歌词亦可在第三方网站获取等提出的进一步论点,最终均未获法院支持。

评析

因此,慕尼黑法院认定,ChatGPT 4和4o模型对歌词的记忆和复制行为构成了侵权,OpenAI需为此承担责任。若OpenAI希望超越法律所允许的文本与数据挖掘范畴,使用歌词来训练其ChatGPT模型,或是在响应用户请求时提供此类歌词作为输出内容,则需获得GEMA的授权许可。

本判决仅涉及ChatGPT 4和4o模型,而OpenAI目前已推出ChatGPT 5.1模型。当被问到本案中涉及的歌曲《Atemlos》的歌词时,当前模型明确表示,基于版权原因无法输出此类歌词,取而代之的是提供歌曲的简短摘要或分析。

本案一个有趣的方面在于其取证路径。法院依据《德国民事诉讼法》第286条,基于对证据的自由评估,推断模型已记忆了歌词,尽管诉讼程序中并未完全阐述具体的技术过程。法院认为,将歌词与输出内容进行比对,足以证明记忆行为的发生。法院指出,即便是针对极其简单的提示,输出内容仍以清晰可辨的形式复制再现了歌词。此外,涉案歌词被用作训练数据这一事实,双方并无争议。

本案与英国法院在Getty Images诉Stability AI一案中所作的判决有所不同。关键区别在于,英国法院并未认定Stable Diffusion模型存储了版权作品的复制件,其认为模型权重“纯粹是模型在训练过程中随时间学到的模式和特征的产物”。

德国法院的这一判决具有重要意义,原因有三:

首先,它划清了合法的文本与数据挖掘与侵权复制行为之间的界限,表明近乎逐字复现的输出内容完全可作为记忆行为的证据,并且这不太符合有关文本与数据挖掘例外情形的条款,特别是在权利人已保留权利且可通过集体管理组织获得授权的情况下。

其次,它凸显了实践中的合规要求:服务提供商需要建立强有力的过滤机制、输出内容抑制措施和来源监管措施,尤其是针对歌词、诗歌和剧本等高风险作品。

再次,鉴于法院对《数字单一市场版权及相关权指令》序言部分及作者使用权益的认可,本案可能会推动集体管理组织在欧盟范围内展开协调一致的执法行动,并促使各方重新调整模型治理策略。

尽管上诉程序可能使上述分析内容变得更为精细或产生调整,但向市场传递的即时信号是明确的:当输出内容与受保护作品过于接近时,法院可能推断存在记忆行为,随之而来的将是授权许可义务。由于判决所依据的条款很大程度上源自欧盟法律,因此预计该判决将对欧盟其他法域人工智能法律的发展产生重大影响。(编译自www.mondaq.com)

翻译:刘鹏 校对:王丹

 

  免责声明:本网转载或编译文章原文均来自网络,不代表本网观点或证实其内容的真实性。若有来源标注错误或涉及文章版权问题,请与本网联系,本网将及时更正、删除,谢谢。

版权所有:国家海外知识产权纠纷应对指导陕西分中心  主办单位:国家级陕西省知识产权保护中心

网站管理:国家级陕西省知识产权保护中心