13910160652
010-52852558
| |EN
首页 > 理论前沿 > 版权
  • 13910160652
  • ciplawyer@163.com

关于生成式人工智能服务侵害著作权问题的探讨

日期:2023-10-07 来源:《中国知识产权》杂志 作者:宋建宝 浏览量:
字号:

摘要:关于人工智能生成内容是否可以获得著作权保护,虽然争论比较激烈,但目前已经形成基本共识。现在的问题是:生成式人工智能在提供服务过程中是否会侵犯他人所享有的著作权?


《生成式人工智能服务管理暂行办法》(下称《暂行办法》)的实施,一方面将为生成式人工智能服务的商业化提供法律依据,另一方面也提出了生成式人工智能服务规范应用的合规义务。例如,生成式人工智能服务提供者不得侵害他人依法享有的知识产权,即为《暂行办法》明确规定的合规义务之一。考虑到目前生成式人工智能服务的训练数据和生成内容主要包括文本、图片、图像、音频、视频等,与《著作权法》所保护的作品密切相关,本文将主要围绕生成式人工智能服务侵害著作权问题进行探讨。


生成式人工智能的基本概念及其工作原理


什么是生成式人工智能?简单来说,生成人工智能就是根据输入指令,运用算法生成并输出符合输入指令要求的、类似于人类创作成果的相关内容,例如文本、图像、视频、音频、图形、计算机代码等。生成式人工智能属于人工智能的一个分支领域。


一个自然人需要历经孕育、生长、发育、培育、教育等过程,最终才能成为一个具有创作能力的人。生成式人工智能也是如此。技术开发人员首先需要进行生成式人工智能的原始模型设计,然后对原始模型不断进行优化改进,形成基本定型的优化模型。原始模型经优化定型后,生成式人工智能就进入数据训练阶段。在数据训练阶段,生成式人工智能被投喂大量数据以完成计算任务,最终保证其生成内容满足某些预期属性。当然,原始模型设计、优化模型设计、模型数据训练并不能够截然分开,而是相互反馈、相互促进甚至是相互融合的。


生成式人工智能的数据训练涉及向算法模型提供大量数据,这是人工智能学习的基础。通过运用大规模、完备的数据集进行训练,生成式人工智能的性能可以不断得到提升。生成式人工智能收集训练数据后,将分析数据模式和数据关系,了解数据内容的基本规则。生成式人工智能在学习过程中还会不断调整其参数,从而不断提高其模拟人类创作的能力。生成式人工智能通过分析用于训练数据的模式、结构、关系等,从包含所需输出示例的训练数据中不断学习,可以生成具有原始输入数据特征的新内容,最终能够像人类一样创作看起来与人类创作内容类似的生成内容。


成功的生成式人工智能至少需要满足三个关键要求:


其一是高质量。特别是对于直接与用户交互的应用程序而言,高质量的生成和输出是关键。例如,在语音生成内容中,如果输出的语音质量比较差,人们自然是难以理解的。同样,在图像生成中,输出的图像应当与人们此前经验中的自然图像在视觉上没有明显区别。


其二是多样性。一个优秀的生成式人工智能可以在不牺牲生成内容质量的情况下,捕获其数据分布中的少数模式,这将有助于减少学习模型中不需要的偏差。


其三是高速度。许多交互式应用程序需要生成式人工智能快速生成所需内容(例如实时图像编辑),以便于在内容创建工作流程中及时得到使用。


生成式人工智能服务的一般法律分析


上文简单介绍了生成式人工智能的基本概念、开发过程、工作原理等。在此基础上,下文将结合《暂行办法》的相关规定,从法律角度对生成式人工智能服务的行为主体、法律关系进行分析,并从互联网演进的角度,将生成式人工智能服务与一些类似的网络服务进行比较分析。


生成式人工智能服务的相关主体


仅就生成式人工智能服务过程而言,牵涉的行为主体主要包括提供服务的生成式人工智能经营者和接受服务的用户。提供服务的经营者就是《暂行办法》所规定的“生成式人工智能服务提供者”,即利用生成式人工智能技术提供生成式人工智能服务(包括通过提供可编程接口等方式提供生成式人工智能服务)的组织、个人[1],负责生成式人工智能的日常运营并按照用户需求提供相应的服务。接受服务的用户就是《暂行办法》所规定的“生成式人工智能服务使用者”,即使用生成式人工智能服务生成内容的组织、个人。[2]


从本质上说,生成式人工智能服务提供者是利用生成式人工智能技术提供网络信息内容服务的经营者。接受服务的用户是接受生成式人工智能所生成的网络信息内容的使用者。根据上文所述,就生成式人工智能的研究开发过程来看,相关行为主体还应当包括生成式人工智能的研发者、训练者。当然,生成式人工智能的研发者、训练者和经营者可能为同一主体,也可能不属于同一主体。


生成式人工智能服务的法律关系分析


如前所述,服务提供者利用经过数据训练的生成式人工智能,根据用户的需求,向用户提供满足特定条件、特定属性的生成内容,可能是一篇文章、一张图片、一个图形或者一段代码等。从法律关系角度来看,生成式人工智能服务提供者和生成式人工智能服务用户是一种网络信息内容服务合同关系。对于生成式人工智能服务提供者和生成式人工智能服务用户之间的合同权利、合同义务,《暂行办法》要求二者应当签订服务协议予以明确。[3]


生成式人工智能服务提供者根据用户需求,依据服务协议,利用生成式人工智能生成网络信息内容,并向用户提供相应的网络生成内容。因此,生成式人工智能服务提供者是网络信息内容的生产者[4]和提供者,而不是网络信息内容服务平台[5]。《暂行办法》第九条也明确规定,生成式人工智能服务提供者应当依法承担网络信息内容生产者责任。


生成式人工智能用户依据服务协议,向生成式人工智能服务提供者提出网络信息内容需求,并接受生成式人工智能服务提供者所提供的网络信息内容。因此,生成式人工智能用户是网络信息内容服务的接受者和使用者[6]。另外,依据服务协议,生成式人工智能用户接受生成式人工智能服务提供者所提供的生成内容以后,往往可以直接使用该生成内容或者在此基础上创作出新的内容。


需要指出,虽然《暂行办法》规定对于生成式人工智能服务提供者和生成式人工智能服务用户之间的权利义务应当签订服务协议予以明确,但是鉴于合同的相对性,服务协议的约束力仅仅限于生成式人工智能服务提供者和生成式人工智能服务用户之间,对于其他人一般不具有约束力。因此,二者就生成式人工智能生成内容的使用、生成内容的著作权侵权责任问题等的约定,对于其他人也不具有约束力。


从互联网演进看生成式人工智能服务


在互联网1.0时代,一些网站运营者自主创建网页、自主生产网络信息内容,然后通过网站网页统一向网络用户提供相同的网络信息内容。网络用户通过浏览器访问网站网页,可以根据其个人需求选择性地阅读网络信息内容。但是,用户只能阅读这些网络信息内容,而不能参与创作。因此,在互联网1.0时代,网站运营者是网络信息内容的生产者,网络用户只是网络信息内容服务的使用者。


在互联网2.0时代,网络用户不仅可以阅读网络信息内容,还可以自主创建网络信息内容,可以在线编写、提供、修改和更新网络信息内容,也可以线下编写、修改和更新网络信息内容后再上线提供。网络平台在这个过程中只是发挥网络信息内容的分享、交流和扩散功能。在互联网2.0时代,网络用户既是网络信息内容的生产者,也是网络信息内容服务的使用者。当然,网络平台运营者也可能是网络信息内容的生产者和使用者。


就生成式人工智能服务来说,生成式人工智能所提供的生成内容实质就是网络信息内容。生成式人工智能服务提供者是网络信息内容的生产者,只不过是利用生成式人工智能技术来生产网络信息内容而已。生成式人工智能服务提供者与互联网1.0时代的网站运营者相比,前者是按照用户需求提供网络信息内容,后者是自主提供网络信息内容,但二者均是网络信息内容的生产者。生成式人工智能服务提供者与互联网2.0时代的网络用户相比,前者是按照用户需求提供网络信息内容,后者是自主提供网络信息内容,但二者均是网络信息内容的生产者。


由上可得,从互联网1.0时代到互联网2.0时代,再到生成式人工智能服务,除去技术变革因素,仅从网络信息内容的生产角度来看,核心均是网络信息内容,发生变化的只是网络信息内容的生产方式和生产者。


生成式人工智能服务的著作权侵权分析


生成式人工智能经过海量数据训练后,如果生成内容符合预期,生成式人工智能服务提供者就可以面向注册用户提供商业化服务。关于人工智能生成内容是否可以获得著作权保护,虽然争论比较激烈,但目前已经形成基本共识。现在的问题是:生成式人工智能在提供服务过程中是否会侵犯他人所享有的著作权?


著作权侵权判定的一般方法与规则


著作权是一种排他性的权利,只能由权利人行使。我国《著作权法》规定了著作权人就其作品享有的各项权利。如果他人未经著作权人的许可而行使了本应当由著作权人行使的权利,就属于侵犯著作权。[7]对于著作权侵权判定问题,我国著作权立法上并没有作出具体规定,也未提供具体方法。法院在司法审判实践中,逐步形成了一系列原则、方法、步骤以及相应的规则。


分析著作权侵权,既可以从侵权人的角度来分析,也可以从被诉侵权物的角度来分析。从侵权人的角度来看,侵权人必须是未经授权而复制、改编、发行、表演或展览了他人享有著作权的作品。从被诉侵权物的角度来看,被诉侵权物必须是复制了或来源于受著作权保护的作品,二者之间存在着表述上的相同或者实质性相似。在司法审判实践中,对于著作权侵权的分析,通常是从被诉侵权物的角度进行的。因此,确认被诉侵权物是否侵犯了受著作权保护的作品,法院首先要审查被诉侵权物是否使用了受著作权保护的作品。其次,法院要审查这种使用是否已经达到了非法占用的程度,即被诉侵权物与受著作权保护的作品是否存在着表述上的相同或实质性相似。再者,法院要审查被诉侵权人提出的抗辩理由是否能够依法成立。


著作权侵权,有直接侵权和间接侵权之分。直接侵权是指他人未经著作权人的许可,以复制、发行、演绎、表演、展览等方式直接使用了受著作权保护的作品。由于著作权是权利人就作品所享有的权利,是权利人控制作品的使用方式的权利,所以直接侵权也可以说是他人未经著作权人的许可而从事了本应当由著作权人从事或控制的行为,或者说他人未经著作权人的许可而使用了受著作权保护的作品。间接侵权是指第三人虽然没有直接侵犯他人的著作权,但协助了第二人的直接侵权,或者由于第三人与第二人之间存在着某种特殊关系,应当由第三人承担一定的侵权责任。我国《著作权法》中没有关于间接侵权的相关规定。在司法审判实践中,对于著作权间接侵权的情形,法院往往适用有关共同侵权的规定,例如《民法典》第1168条规定的共同实施侵权行为,以及第1169条规定的教唆帮助他人实施侵权行为。


生成式人工智能数据训练活动的著作权侵权分析


如前所述,就生成式人工智能的研发过程和运营过程来看,相关行为主体包括生成式人工智能的研发者、训练者和运营者。生成式人工智能的研发和训练是密不可分的,且生成式人工智能的研发者和训练者往往是同一主体。因此,应重点分析生成式人工智能的数据训练活动是否构成著作权侵权。


生成式人工智能的预训练、优化训练等数据训练活动,需要从互联网上抓取数据进行训练,然后通过其算法来生成相应的文本、图片、音频、视频、代码等内容。如果生成式人工智能的训练者未经著作权人的许可,从互联网上抓取他人享有著作权的作品用作训练数据对生成式人工智能进行训练的,应当属于未经著作权人的许可而使用受著作权保护的作品的情形。依据著作权侵权判定的一般原则,生成式人工智的数据训练活动可能构成著作权侵权,并且构成直接侵权。


《暂行办法》第七条规定,生成式人工智能服务提供者应当依法开展预训练、优化训练等训练数据处理活动,涉及知识产权的,不得侵害他人依法享有的知识产权。此处的知识产权自然应当包括著作权。但是需要指出,处于训练阶段的生成式人工智能,毕竟尚未正式投入商业化运营,因此对于这一阶段的数据训练活动是否认定构成著作权侵权,尚有司法政策上的探讨空间。


生成式人工智能提供服务活动的著作权侵权分析


生成式人工智能的生成内容所依赖的数据和算法,是由生成式人工智能服务提供者确定的。因此,对于生成式人工智能服务的管理规范重点对象应当是服务提供者。《暂行办法》第四条规定,提供和使用生成式人工智能服务,应当尊重知识产权、商业道德,保守商业秘密,不得利用算法、数据、平台等优势,实施垄断和不正当竞争行为。


经数据训练后,能够达到预期目标的生成式人工智能就可以正式投入商业化运营,向注册用户提供生成式人工智能服务。如前所述,生成式人工智能服务提供者和用户是一种有关网络信息内容服务的合同关系,生成式人工智能服务提供者依据服务协议并根据用户需求,利用生成式人工智能技术生成并向用户提供网络信息内容。


如果生成式人工智能服务提供者所提供的生成内容与他人享有著作权的作品存在着表述上的相同或者实质性相似,则构成著作权侵权判定上的实质相似,可能构成著作权侵权。根据前述著作权侵权判定的一般规则,即使生成式人工智能服务提供者所提供的生成内容与他人享有著作权的作品构成实质相似,尚须有证据证明生成式人工智能服务提供者所提供的生成内容是复制了或来源于受著作权保护的作品。如果有证据证明,生成式人工智能服务提供者所提供的生成内容确实复制了或来源于受著作权保护的作品,那么从被诉侵权物的角度来说,就可以认定构成著作权侵权。在构成著作权侵权的情况下,生成式人工智能服务提供者是被诉侵权物的制作者和提供者,生成式人工智能服务用户是被诉侵权物的使用者,并且被诉侵权物是生成式人工智能服务提供者按照生成式人工智能服务用户的需求和指示进行制作和提供的。可以说,被诉侵权物是生成式人工智能服务提供者与用户共同行为的结果。因此,在生成式人工智能的生成内容构成著作权侵权的情况下,判定生成式人工智能服务提供者与用户构成共同侵权,还是判定生成式人工智能服务提供者构成单独侵权,也是一个有待司法裁判予以明确的问题。


需要指出,提供证据证明生成式人工智能的生成内容是复制或来源于受著作权保护的作品,对于著作权人来说几乎是不可能完成的任务。在生成式人工智能的生成内容与他人享有著作权的作品构成实质相似的情况下,笔者认为可以适用举证责任倒置,推定生成式人工智能的生成内容复制了或来源于他人享有著作权的作品,然后由生成式人工智能服务提供者提供相反证据来证明生成式人工智能的生成内容并不是复制或来源于他人享有著作权的作品。这是因为生成式人工智能的生成内容所依赖的数据和算法是由生成式人工智能服务提供者确定的,并且生成式人工智能只是将其此前数据训练过程中所学习和掌握的网络信息内容依据输入指令采用不同方式进行了不同程度的合成,实际上并没有创造出全新的内容。


注释:


[1]参见《生成式人工智能服务管理暂行办法》第二十二条。


[2]参见《生成式人工智能服务管理暂行办法》第二十二条。


[3]参见《生成式人工智能服务管理暂行办法》第九条。


[4]参见《网络信息内容生态治理规定》第四十一条,网络信息内容生产者,是指制作、复制、发布网络信息内容的组织或者个人。


[5]参见《网络信息内容生态治理规定》第四十一条,网络信息内容服务平台,是指提供网络信息内容传播服务的网络信息服务提供者。


[6]参见《网络信息内容生态治理规定》第四十一条,网络信息内容服务使用者,是指使用网络信息内容服务的组织或者个人。


[7]李明德:《知识产权法》,社会科学文献出版社,2007年5月第1版,第152页。