13910160652
010-52852558
| |EN
首页 > 理论前沿 > 版权
  • 13910160652
  • ciplawyer@163.com

“人工智能”与美国著作权法:对应和挑战

日期:2023-11-08 来源:《版权理论与实务》 作者:孙远钊 浏览量:
字号:

目次

    

壹、从模仿到仿人

贰、定义与问题

一、概念定义

二、原理与操作

叁、生成式人工智能的著作权问题

一、输入端

(一)“崔布雷诉OpenAI集体诉讼”案

(二)“匿名作家诉OpenAI集体诉讼”案

(三)“西尔弗曼诉OpenAI集体诉讼”案

(四)“盖蒂图像公司诉稳定迭代人工智能公司”案

(五)“安德森等诉稳定迭代人工智能、Midjourney和DeviantArt公司”案

(六)“匿名者诉GitHub、微软及OpenAI”案

(七)端倪、问题与挑战

二、输出端

(一)美国版权局的政策

(二)司法实践与发展

(三)争议与评论

肆、结论



【摘要】


当一位知名的作家向人工智能应用ChatGPT提问对自己的作品的意见时,ChatGPT在极短时间就生成了一篇非常详尽的摘要和分析。但这也强烈意味著开发这款人工智能工具的企业OpenAI没有经过作者的许可,就通过对其作品的全部或绝大部份复制,对ChatGPT进行了“深度学习”。究竟这是否构成著作侵权行为,抑或合理使用?目前已成为美国法院必须面对和处理的问题。


另一方面,人工智能的生成物是否应该获得著作权的保护?目前美国版权局新出台的政策和联邦地区法院的判决已提供了初步的答覆:只有自然人才具有“作者资格”,也只能从“作者”的独创表达才能获得著作权的保护。但是在这个看似简单明了的基本原则背后,却还有著一连串既有趣、又复杂的问题需要厘清。


本文拟对美国著作权法制体系如何对应近来人工智能发展所带来的挑战进行一个比较详细的梳理,包括检视目前引起了许多关注的八个关于侵权、一个关于赋权的“测试案件”,并提供未来应如何继续有效对应的前景分析。


【关键词】


人工智能、著作权、深度学习、独创性、合理使用


壹、从模仿到仿人


人类天生喜好模仿。[1]也以此作为学习和求生的本能,让本来在几乎各个方面与其他动物相较都不具优势,且对自身非常不利的环境下,却能运用唯一的工具 —— 智慧,不断地尝试、探索、适应而生存了下来,并登上了食物链的顶端,成为当前地球上最具优势的物种。也正是因为人类的好奇、探索和模仿促成了各种创新与发明。[2]人类除了模仿周遭的人物,也同样期待“被模仿”并以此为基础从事更多的附加创新。自古以来已经出现了以人类自己为核心(或“拟人化”的呈现anthropomorphizing),再结合不同物种的优势形成更优的“超人类”便不断在许多的神话和传说之中出现,如狮身人面、人马兽等等。


一个直接反应了这个人类特性的著名神话故事是,属于半人半神的普罗米修斯(希腊文:Προμηθεύς/ Promētheús)从奥林匹斯山(Όλυμπος/Mt. Olympus)偷了火种送给人类。当众神之王宙斯(希腊文:Ζεύς/Δίας)得知此事之后大怒,于是命火神赫菲斯托斯(希腊文:Ἥφαιστος、英文:Hephaestus)用黏土打造出了世间第一位女性潘朵拉(希腊文:Πανδώρα、英文:Pandora),另铸造了一个让她随身的金属“盒子”(其实应该是个坛子(πίθος/pithos),却一直被误译)送给人类作为惩罚。宙斯的妻子赫拉(希腊文:Ἥρα/Ἥρη、英文:Hera)则赐予了好奇心给她。她因为自己的好奇心打开了那个金属盒子,结果释放出了所有邪恶到人间:贪婪、虚伪、诽谤、嫉妒、痛苦、战争等等,等她把“盒子”盖上时,只剩“希望”(Elpis)还留在其中。[3]火神赫菲斯托斯的另一项“成就”是用青铜打造了一个名叫塔罗斯(希腊文:Ταλως、英文:Talos)的机械巨人,具有高度的智慧,能自动操作,帮助宙斯守护克里特岛(希腊文:Κρήτη、英文:Crete)。


关于塔罗斯的神话故事应是目前已知最早的、涉及到今天被称为“人工智能”的记载之一,也足证这样的想法(哪怕还只停留在纯粹属于想像或幻想的阶段)自古早已有之。从古以降,无分东西文化,各种具体的尝试也从未间断,诸如人工服务员、自动杀人的器械、不计其数的监视控制系统和娱乐工具等等,诚可谓渊远流长,各家文化皆所见略同。[4]


当代“人工智能”的滥觞一般是溯及到英国的艾伦·图灵(Alan M. Turing, OBE FRS, 1912-1954)博士(被誉为计算机科学与“人工智能之父”)和于1956年夏季在美国举行的“达特茅斯会议”(Dartmouth Conference)。图灵在他的经典论文中开宗名议题出了一个问题:“机器能思考么?”继而以“模仿游戏”(The Imitation Game)来论证这个命题的荒谬性与可能的思路,并推导出了著名的“图灵测试”(Turing Test)和符号操作可能就是人类思维的本质的新思路。[5]“达特茅斯会议”则是正式确定了以“人工智能”作为研究领域的称谓以及系统性地梳理出了多个相关的理论和未决的问题,对未来的研发提供了一些可行的具体方向,指出“学习或智能的任何其他特性的每一个方面都应能被精确地加以描述,使得机器可以对其进行模拟”。[6]从此“人工智能”的发展经历了70年的筚路蓝缕和多次的起伏,有时获得了一定的成功、突破,也遭遇了许多的瓶颈、挫败甚至倒退。[7]


贰、定义与问题


一、概念定义


最近于“人工智能”的发展又到了一个向上攀升的阶段(也有人认为是“突破”,但还有争议),而且由于诸如ChatGPT(是Chat Generative Pre-trained Transformer(聊天生成预训练转换器)的简称)、DALL-E(名称是著名画家萨尔瓦多·达利(Salvador Dali)和皮克斯动画工作室(Pixar Animation Studios)的电影《机器人总动员》(WALL-E)的组合)、DALL-E 2、Midjourney等应用软件或工具的出现,让社会的关注和兴趣达到了空前新高。但如果仔细探究即不难发现,各界至今对于究竟什么是“人工智能”、范围应当为何等问题都还没有取得共识,因此既有的法律(包括国际公约)也还没有统一、明确的定义(不过欧盟可能即将通过首个针对“人工智能”并对所有成员国具有强制效力的条例,其中有一个定义条款,详见后述)。


前已述及,“人工智能”的名称是个“舶来品”,从英文“artificial intelligence”的字面意义直译而来。不过这个中文称法容易产生误导,让人产生各种“拟人化”的联想,把一个机器工具在概念上转化成了一个彷佛具有“准人性”思维的“机器人”(或许與以往好莱坞制作、拍摄电影了许多相关的科幻影片相关)。因此倒不如称为“仿智能”或“智能人工”,因为“artificial”本身就寓含了一定程度的伪作、仿制的意思。[8]至于通过机器工具给予的辅助或其本身的功能与操作要达到如何程度才构成所谓的“人工智能”,各界可能会有相当大的认知差异。例如,英国的国防科技实验室认为,人工智能必须同时具备四个要素:(一)数据、(二)软件程序(逻辑演绎)、(三)平台、以及(四)整合。[9]按照这个要求,殖入人体自动从事器官修补或药物治疗的纳米芯片和相关器材(纳米转染技术nanotransfection)就未必会被视为具有人工智能,但在一般的认知上卻可能得到相反的结论。[10]


联合国教育、科学及文化组织(United Nations Educational, Scientific and Cultural Organization, UNESCO)的193个成员于2021年11月23日以全票通过了一个不具法律拘束力,但却至关重要、值得各国未来在制定相关的国内立法时借鉴参考的文件,称为《人工智能伦理问题建议书》(Recommendation on the Ethics of Artificial Intelligence)。其中将人工智能系统视为“有能力以类似于智能行为的方式处理数据和信息的系统,通常包括推理、学习、感知、预测、规划或控制等方面”。[11]换句话说,“人工智能系统是整合模型和算法的信息处理技术,这些模型和算法能够生成学习和执行认知任务的能力,从而在物质环境和虚拟环境中实现预测和决策等结果。在设计上,人工智能系统借助知识建模和知识表达,通过对数据的利用和对关联性的计算,可以在不同程度上实现自主运行。”[12]


欧洲联盟(European Union,以下简称欧盟)目前正拟制定《人工智能法》(Artificial Intelligence Act)作為通行全欧盟的强制性条例(regulation)。[13]这个立法草案的第3条第(1)款拟将“人工智能”定义为:“以一或多种特定的方式和路径,依据由人类定义的一组目标,生成如内容、预测、建议或决定等会影响其互动环境所开发的软件”。[14]至于“特定的方式和路径”究何所指,则交由随附于该法的《附件一》(Annex I)予以规制(刻意不直接规范在条文中,以保持弹性和机动性,可随相关科技与市场的发展与变化快速调整对应)。该《附件一》(草案)目前列出了三种类型:


(一)机器学习演算(machine learning approaches);


(二)逻辑与知识演绎算(logic- and knowledge-based approaches),包括知识表示(knowledge representation)、归纳编程(inductive programming)、知识库(knowledge bases)、演绎及归纳引擎(inference and deductive engines)等;以及


(三)统计演算(statistical approaches)、贝叶斯概率估计(Bayesian estimation)、搜索和最优化方式(optimization methods)。[15]


二、原理与操作


从上列的论述可见,无论如何定义人工智能,都指含有对应和生成两种功能的软件系统。目前引起社会高度兴趣和关注的“大型语言模型”(Large Language Model,简称LLM)是以其庞大的规模来指称特定类型的人工智能操作。[16]在技术上通过人工智能加速器(AI accelerator)[17]来对参数量(weights)达到数十亿或更高的文字或文本数据(主要的信息来源是互联网,如《维基百科》(Wikipedia)等等)予以处理和运算(即所谓的“深度学习”(deep learning)),包括“无监督”或“自监督学习”(self-supervised learning,简称SSL)[18]和“半监督学习”(semi-supervised learning,也称为“弱监督”(weak supervision))[19]等。另通过“变换器模型”(transformer architecture)进一步加速整个机器学习的过程。[20]继而是对于数据集(dataset)的处理,包括对数据集纯化(dataset purification,像是移除所谓的“有毒通路”(toxic passages)、抛弃“低质量数据”(low-quality data)和删除重复数据(de-duplication)等等)以及使用“概率标记”或“概率术语”(probabilistic tokenization),也就是一种改良式的字节对编码(byte pair encoding,简称BPE,或“双字母组合编码”(diagram coding)),通过贝叶斯概率估计等计算方法,让机器工具的学习以及对文字的表达能更为精准。简单地说,这样的功能和操作犹如人类考试时经常使用的“填充题”作答,由机器工具以尽量拟人化的方式通过逻辑演绎算法“猜测”一个问题(或给予的提示prompt)最可能与最适当的后续对接应当为何,以帮助从事操作的人类去进一步推导、分析,然而从不保证给出答案的正确性(虽然绝大多数的使用者似乎都会推定或假定人工智能总应给出最全面详细、精确无误的答覆)。这也就注定了恐将引发各种潜在(或已发生)的争议。


除了“大型语言模型”,另一个受到了社会高度关注和兴趣的,是以“扩散模型”(diffusion models)或扩散概率模型(diffusion probabilistic models,也称为基于分数的生成模型(score-based generative models))为基础,用变分估计或推断(variational inference)方式训练的马尔可夫链,使其最终的结果或效果既能生成新的事物(主要是图像),也同时要尽量贴近甚至符合原来的数据分布,以确保不会产生离谱的结果(近似于人类的“模仿”)。[21]目前这个模型主要应用于图像的生成、修复、“去噪”与超分辨率成像等领域,知名的软件程序有Dall-e、其下一代Dall-e 2、Midjourney和Stable Diffusion(稳定扩散)等。


由此可见,“人工智能”或“智能人工”原本的设计初衷和操作就是希望借助机器工具做到人类自身原本难以或根本无法做到的事情。这与詹姆斯‧瓦特(James Watt, 1736-1819)发明了含有分离式冷凝器的蒸气引擎、乔治‧斯蒂芬森(George Stephenson, 1781-1848)发明了火车头与铁道交通或是伊莱‧惠特尼(Eli Whitney, 1765-1825)发明了轧棉机(cotton gin,或轧花机)等,结果带动了第一波的工业革命在本质上并没有如何的不同。后来的几波工也革命也是如此。附带一提,历史一再表明,虽然每一波的推展的确取代了不少原来的工作,但也同时开创出了更多、更高薪的就业机会。[22]


固然最近的人工智能发展的确展现出了无数令人无比惊艳,甚至瞠目结舌的成果,但是在未来的应用上却同时具备了极大的潜质与风险。《智能的本质》一书的作者皮埃罗‧斯加鲁菲(Piero Scaruffi, 1955-)便指出,机器工具的“深度学习”是在学习人类已做过的事情(过去时)的技术。如果揭开光鲜亮丽的表象,人工智能领域的主流技术在本质上仍然是图灵机的架构(通行的智能手机和笔记本电脑也还是这一结构);经过几十年的发展,其最大的变化是硬件速度与性能的提升,在算法逻辑上并没有根本性的革新与改变,仍然是同样的基本面,万变不离其宗 —— 人们取得的进步在本质上只是将更多的高性能处理器连结起来,给了机器神经网络更大的空间来模拟人类大脑的思维。[23]他也由此点出了另一个关键:人工智能最大的问题是没有常识,因此不能被信任。[24]人们已经花了几十年去尝试解决这个问题,但不排除可能用错了方法。现在整个重心都在深度学习,但深度学习不能获取常识。深度学习只是收集许许多多的数据,基本上做的是统计工作。[25]因此,诸如人工智能能够在人类的律师考试获得高分或是下围棋击败世界冠军等等是这类机器工具凭借对大数据的统计分析原本应该做到的基本要求;如果无法超越人类自身都可以达到的水平,就意味著应该要遭到淘汰了,但这与“思考”还有很大的距离。也因此在讨论涉及人工智能的问题时,至少在现阶段不能用某种拟人化的寄情去投射(如“机器人”),否则极易自我误导。


叁、生成式人工智能的著作权问题



图左:维米尔(Johannes Vermeer)的《戴珍珠耳环的少女》(c. 1665)。图右:德国人Julian van Dieken通过Midjourney软件生成的《戴亮丽耳环的少女》。


无论是文字或图像,目前的生成式人工智能已可在极短的时间内犹如变魔术般的生成各种令人惊艳的结果。位于荷兰海牙(The Hague)的莫瑞泰斯皇家美术馆(Mauritshuis)借著其“镇馆之作”,约翰内斯·维米尔(Johannes Vermeer)的《戴珍珠耳环的少女》(荷兰文:Meisje met de parel)到外地巡展之际,征集了一幅用人工智能生成,以该画作为基础的一幅“替代品”放在原来暂时空出的位置上,名为《戴亮丽耳环的少女》(A Girl With Glowing Earrings),结果引起了相当激烈的争议,包括人工智能的生成图像是否能被视为“艺术品”,并在莫瑞泰斯美术殿堂占有一席之地?那幅画作是否过于“虚假不实”(例如无论使用如何的透视都不可能看到右耳的耳环、皮肤的质理与上色都显然失真、脸上的雀斑相当“诡异”等等)?等等。有的人则认为这象征了该馆能与时俱进,采纳新知。而该馆收到各界最多的抱怨和质疑,是关于这幅画作是否侵害了他人的著作权。[26]


2023年1月纽约现代艺术博物馆“瑞非克‧安那多尔:无人监督”(Refik Anadol: Unsupervised)特展的展厅(Gund Lobby)现场。摄影:Ben Davis, ArtNet News。


与位于美国纽约市(New York)的现代艺术博物馆(Museum of Modern Art,简称MOMA)则更进一步。他们首先提问:如果机器遍览了本馆的所有藏品之后,能“梦想”出什么?继而邀请了美籍土耳其裔的多媒体艺术家瑞非克‧安那多尔(Refik Anadol),运用这个提示和人工智能创作了一个永不重复,能不断变化的视觉立体呈现,并从2023年开始举行一场名为“瑞非克‧安那多尔:无人监督”(Refik Anadol: Unsupervised)的特展。全部的画作都以一整面的大屏幕墙(24 x 24英尺,约合7.32 x 7.32米)和超高清画素的投影来显示,而且呈现出的立体图像场景会随周遭环境因素的改变(如晴天、下雨、光线、人群的移动等等)跟著产生各种变化。[27]因此这也不可避免地产生了许多的法律问题。即使先行搁置能否获得著作权或构成侵权的争论,仅是这些画作究竟应该“归功”(attribution)于谁(即如何署名)便可能会引起很大的争议甚至冲突:给出“提示”的人?人工智能本身?开发该人工智能的人(软件设计者或(和)其雇主)?还是提供作为机器“深度学习”的各个对象的作者?其次是,纵使可对人工智能的生成物赋权,对于一个没有固定形态、不断在变化的呈现是否符合“固定”(fixation)的要求?所涵盖的范围究竟应该为何?


一、输入端


由于人智能全必须通过对既有材料的收集从事“深度学习”,在先天或定义上从输入端开始便总是需要对他人既有的文字、声音或图像等各种作品的数字档案进行全面或相当程度未经许可的复制,也意味著承载了高度的侵权风险(除非能举证符合或构成合理使用)。[28]对于权利人而言,也同样寓含了非常高难度的举证挑战,因为既然人工智能的“深度学习”几乎总是涉及对来自无数作者的大量作品从事大规模的复制,然后以类似回收资源运用的方式,先予以碎片化,再通过软件以统计分析的处理重新组合,要如何从最终的生成结果进行回溯,并识别、指认其中的哪个部份是对哪位特定作者的哪个特定作品的复制势将非常的困难。


在合理使用的抗辩方面,美国《著作权法》第107条的一般判定法则采取了所谓的“四要素分析法”:(1)使用的目的和性质,包括是否在本质上属于商业性的使用抑或非营利的教育目的;(2)被从事使用、具有著作权的作品性质;(3)相对于被使用的作品整体,所使用的数量和程度;以及(4)其使用对受到著作权保护的作品的潜在市场或价值产生的影响。[29]后来的司法实践对其中的第一个要素又增列了应考量是否具有足够的转化或转型(transformative)。虽然这四个要素应等质等量齐观,但被指控侵权物的转化程度往往会对法院的判决产生决定性的影响。[30]


对于以含有著作权的作品来训练人工智能支持应构成合理使用的一方(如Open AI等从事人工智能开发的企业)认为,如果检视第一个要素,“深度学习”的性质和目的应属于转化性而非表达性(expressive)的使用,因为通过这样的训练过程才能形成一个非常具有实用价值的生成式系统。此外,由于整个系统的学习训练过程并不对外开放,因此上述的第三个因素也应对其有利。赞成方试图援引“谷歌图书案”的二审判决作为依据。[31]联邦第二巡回上诉法院在该案判决,谷歌公司以电子扫描复制了所有图书馆的藏书,并以此创设了一个可供搜寻的超大型数据库,但对使用者的搜索结果只从每册书的电子档摘取其中小部份的内容呈现构成合理使用。因此,赞成方认为,只要人工智能的生成结果不是把特定作品的全部或相当部份原封不动地重新呈现,也应同样地构成合理使用。


不过反对方则指出,如果的确只是为了“自我学习”之用,那么构成合理使用或有可能,但生成式人工智能显非如此。这类机器工具在设计的本意和功能上就是要在既有作品的基础上运用统计算法来推测接下去的可能表述(无论是文字或图像),因此形同对原作品从事“续写”或“改编”,并不是真正的转化性使用。况且这类工具最终是为了要推向市场,从事各种可能的商业开发和利用,所以也绝非止于单纯的“学习”而已。


5.png

饶舌歌手Drake(左)和The Weeknd(右)于2014年3月25日在英国伦敦O2体育馆(The O2 Arena)的现场表演(来源:BBC广播网)。


至于上述的第四个要素,反对方则指出,如果容许可以“学习”为名,让人工智能从事各种“仿真”之作,不但会对消费者造成困扰,也显然对原作者构成直接的竞争。例如,2023年4月14日由一个署名为“Ghostwriter977”(这个名称本身就寓含了代笔或影子作者之意)推出,名叫“袖上我心”(Heart on My Sleeve)[32]的歌曲,宣称是由目前当红的两名加拿大饶舌歌曲明星德雷克(Drake)和威肯(The Weeknd,华语圈常因其头发造型被昵称为“盆栽哥”)合唱,结果立即引起了很大的轰动。然而实际上这是由人工智能所生成的结果,虽然其中的声音极度逼真,终究与两位歌手完全无关。当环球音乐集团(Universal Music Group)在三天后(17日)将此曲从各流媒体平台全面下架时,这首“伪歌曲”在抖音(TikTok)的流量已突破了1,500万人次,在思播(Spotify,或“声田”或“声破天”)播放了超过60万次、在“油管”(YouTube)则超过了27万5千次的观赏。[33]


6.png


受到此一事件的刺激,整个音乐产业已经展开了对应这种“伪歌曲”甚至于整个人工智能开发的“总动员”。他们一方面向从事人工智能开发的企业和研究机构等提出了严厉的警告,包括将提出规模性的诉讼,另一方面由40个最具规模和影响力的权利人组织联合组建了针对人工智能问题的一个全新的权利人联盟,并提出了7个核心原则。凡是不符这些原则的,将进行全面性的抵制(boycott,或杯葛)和诉讼,也不排除会有更多的对抗,运用各种可行的手段让人工智能无法接触、取用仍受著作权保护的各类词曲。[34]


此外,美国的作家协会(Authors Guild)发布了一封公开信,呼吁从事生成式人工智能的科技公司除非经过适当的许可或费用支付,必须立即停止使用含有著作权的作品。[35]截至2023年7月中旬,这封信已获得了超过一万名作者的连署,其中包括了多位国际知名的作家。[36]


这些发展形同向人工智能的业者发出了最后通牒,犹如之前多次创新科技发展的历程,在科技发展与内容提供两者之间用法律切出了一道鸿沟,在硝烟弥漫、尘埃未定之前,势将对人工智能的后续开发、使用、与商业模式的建构形成巨大的压力和制约。不过就在权利人组织紧锣密鼓备战之际,个别战役已然展开:


(一)“崔布雷诉OpenAI集体诉讼”案


既然循著法律途径来解决争端已势不可免,最终会有决定性影响的自然还是法院判决。目前在各地不同的联邦地区法院已出现了多个待审的诉讼。例如,知名的畅销恐怖及黑色幽默小说作家莫娜‧阿瓦德(Mona Awad)和保罗•崔布雷(Paul Tremblay)于2023年6月28日联名起诉了开放人工智能研究中心(OpenAI),并邀请其他作者加成为一个集体诉讼(class action),指控后者在从事其人工智能系统的“深度学习”过程中,未经许可也未支付任何报酬或费用,大量“摄取”(ingesting)了原告等人受著作权保护的作品。[37]OpenAI在2018年6月曾自行披露,他们“训练”其第一代人工智能GPT-1系统的一个重要来源是当时已经颇受争议,名为BookCorpus的大型书籍文本数据集(这个数据集又从一个名为Smashwords.com的网站收录了无数尚未正式出版、但几乎都还有著作权的作品),后来的版本与机器学习则更“变本加厉”。原告的指控并主张,当他们向ChatGPT提示自己的作品名称,后者便可立即对其小说的内容提供极为详尽的介绍和摘要,也就表明和证明了他们的小说已被用来作为训练人工智能的素材。另据OpenAI于2020年7月自行发布、介绍其GPT-3的说明文件透露,该系统使用的训练素材中有15%是来自“两个以互联网为基础的书籍语料库(corpora)”,分别被冠称为“书库1”和“书库2”。起诉书综合各方信息,估算“书库1”约包含了63万个书目,“书库2”则应有29万4千部书籍。并据此指控和主张,由于ChatGPT使用的大型语言模型必须完全依靠各种内容的存在才能操作,其本身便是一个派生或衍生侵权物,侵害了其中所有作品作者的复制权与改编权。[38]


(二)“匿名作家诉OpenAI集体诉讼”案


也在同一天,一家名为Clarkson的公益法律事务所代表12名作者向北加州联邦地区法院提出了一个范围更广的集体诉讼(还包括刑事自诉,但却完全没有涉及著作侵权的指控),指控被告OpenAI开发的ChatGPT人工智能系统违反了联邦《电子通信隐私法》[39](刑事)、《计算机欺诈及滥用法》[40](刑事)《侵害隐私法》[41](刑事)和《反不正当竞争法》[42](民事)等规定。[43]


(三)“西尔弗曼诉OpenAI集体诉讼”案


此外,美国的喜剧演员、节目制作人及作家萨拉·西尔弗曼(Sarah Silverman)联合另外两名作家于2023年7月7日也提出了一个集体诉讼,指控OpenAI及其相关事业开发的ChatGPT等生成式人工智能对他们的作品构成著作侵权,例如未经许可复制了西尔弗曼的回忆录《胆小鬼》(The Bedwetter,字面直译是“尿床者”)。其举证与上述的《崔布雷诉OpenAI》案非常类似,也是从人工智能可以对其作品从事极为详尽的描述反向推导出,除非人工智能对其作品从事了全部或大量的复制,否则绝不可能会给出如此详尽的归纳。


(四)“盖蒂图像公司诉稳定迭代人工智能公司”案


除了OpenAI已陆续遭到愈来愈多的侵权诉讼,其他的人工智能开发企业也难以幸免。不过在举证方面,主张图像生成构成侵权的原告或将面临更大的难度。例如,国际知名的相片图库运营商盖蒂图像公司(Getty Images)于2023年2月在特拉华州联邦地区法院起诉稳定迭代人工智能公司(Stability AI, Inc.),指控被告对其图库内超过1,200万个仍有著作权的摄影作品从事了未经许可的复制,也未支付任何的许可费用,另指控被告侵害了其商标权并从事不正当竞争等。在指控著作侵权的部份,盖蒂图像公司认为,被告容许其使用者运用其开发的“稳定扩散”(Stable Diffusion)人工智能软件系统与生成模式,可对获取到的摄影图像,尤其是附随于每帧摄影作品的简短解说,从事更正确的机器学习(建立图像与文义之间的关联),也让使用者能从事各种后续性的改编运用,再从中收费获利,也就与原告形成了直接的竞争关系。[44]


7.png


作为初步的举证(即大体证据prima facie evidence)之一,原告在起诉书里提出了两个供比对的图像。上左图是英国足球明星大卫‧贝克汉姆(David Beckham)在一场比赛中的实况,并打上了原告的水印;上右图则是被告人工智能模型的生成图像,仍可看到被扭曲呈现的水印和白色球衣上被稍事改变的英文字样(白衣球员的右腿和右脚并呈现出不自然的扭曲)。原告拟以此来反向举证被告显然全盘复制和改编了原告的作品。在另一个举证,被告的生成图像依然清晰可见原告的水印(仅有轻微的扭曲),但是其中的人物脸部却明显地被“丑化”了(至少以人类的主观标准而言),因此原告主张不但侵害了其作品的复制权与改编权(皆为财产权 — 除了视觉艺术作品,美国现行著作权法并不承认如作品完整性等人格权),还造成了对原告商标的侵权和商誉的诋毁与破坏(见下图)。


8.png


这两个举证因为包含了原告的浮水印,所以还能相对明确的显现出两者之间可能存在的关联性。至于法院是否接受,抑或认为是构成足够的转化性使用,还有待后续诉讼的发展给出答案。无论如何,此处恐怕还有个必须先决的事项:盖蒂图像公司是否具备作为本案原告的诉讼资格(standing,即当事人适格),亦即原告必需证明其确实为所有图像的权利人或独占被许可人(exclusive licensee)。[45]


(五)“安德森等诉稳定迭代人工智能、Midjourney和DeviantArt公司”案


9.png


在另一个关于图像生成的诉讼,知名的漫画家莎拉·安徒生(Sarah Andersen)联合另外两位艺术家于2023年1月13日向北加州联邦地区法院起诉了稳定迭代人工智能、Midjourney和DeviantArt(“异艺”)等知名的人工智能图像生成企业。[46]原告在起诉书中试图从人工智能扩散模型的若干逻辑算法和实际操作等来初步举证(或反向推导)被告复制了原告的作品。左图是人工智能如何把原本两个来源不同的头像照片予以叠加,通过对“形象流形”(image manifold)与像素—空间插值(pixel-space interpolation)的处理,再加上“去噪插值”(denoised interpolation)的手段,最终合成为机器的生成图像,也称为“扩散来源”(diffused source)。原告认为这样的手段就构成了对其作品的改编,形成了派生性的产物。换句话说,固然原告承认难以从最后的生成图像去拆解并指认是哪些地方对原告的作品从事了复制,实际上是人工智能对个别原告的作品都从事了完全或几近完全的复制,然后再与其他的作品混同并均匀扩散到最终的生成图像的每个画素或象素之上(而且即使来源相同,每次生成的图像也未必相同,可能有各种不同的变化)。


主审本案的威廉‧奥里克三世(William Orrick, III)法官在2023年7月19日对双方提出的多项程序性请求(或声请motions)举行了听证。随即当庭表示,他倾向于驳回原告绝大多数的主张,但会容许原告方重提一个修正的起诉书。他表示,原告应更清晰地阐明并区分对三个共同被告的具体指控,并且由于原告可以接触和取用被告稳定迭代人工智能公司的源代码,也应可提供更多的事实来补强其起诉书,否则鉴于该人工智能系统已阅读了50亿个压缩图像档案,很难明确三位原告的作品是否果然涉及其中。他并认为,对于原告所主张,只要是用他们的姓名作为给人工智能的“提示”所生成的图像就都构成了著作侵权一点,恐怕也难以成立。不过他同时表示,对安徒生女士指控被告直接侵权其作品的部份应可通得过被告请求法院以没有实证为由全部驳回的首波挑战。[47]换句话说,法官认为共同原告在绝大多数的情况下还没有建立其作品与被指控侵权物之间具有一定或足够的“指向性”。这也是在欠缺如水印或其他技术保护措施的辅助,只凭借作品本身来指控人工智能生成的物件侵权将会遭遇到的举证短版或硬伤。[48]


(六)“匿名者诉GitHub、微软及OpenAI”案


除此之外,代理上述艺术家案件的同个法律事务所已于2022年11月3日代表两位匿名当事人(称为“John Doe 1”和“John Doe 2”,如同中文的“张三”或“某甲”)先行发动了一个集体诉讼,起诉目前全球最大的软件源代码托管服务平台GitHub,其母公司微软和微软投资的合作企业OpenAI,挑战GitHub的核心产品,也是人工智能编码辅助工具GitHub Copilot以及由OpenAI开发,在后台驱动并操作GitHub Copilot的软件产品OpenAI Codex等两套软件的合法性。[49]如果前述的五个案件都能获得法院的支持,虽然潜在的损害赔偿与法院禁令等已然非常可观,但终究还只算是“皮肉之伤”,仍或有挽救的机会与可能。反之,如果原告在这个诉讼的主张成立,那么对目前人工智能主要模式的发展则可能真正会“伤筋错骨”,动摇到根本。


GitHub是个以开放源代码和云计算为基础的平台,让软件开发者可以共同协作,形成一个分散或分布式的版本控制系统(distributed version control system),即不需要依赖一个中心服务器,任何一台机器都可以有一个本地版本的控制系统,来操作如错误跟踪(bug tracking)、存取控制(access control)、任务管理(task management)和持续集成(continuous integration)等功能,并将所开发的软件存放,交由平台托管。这个平台是于2007年10月19日启动,翌年4月正式对外开放,自2018年10月26日起成为微软公司的全资子公司。截至2023年1月,使用其平台的软件程序开发者已超过一亿人,其源代码的库存量则超过了3亿7千2百万个(组),是目前全球最大的源代码托管平台。[50]


原告主要指控微软与OpenAI通过GitHub平台和使用由其于2021年6月开发上市,称为“副驾驶员”(Copilot)的软件通过互联网抓取(scraping)了大量的信息用于开发其人工智能软件,尤其是可将人类自然语言转化为程序代码的Codex模型:(1)违反了自己所订的服务条款与隐私政策,包括不当抓取或窃取网络信息,未遵循相关的开源代码许可协议(如GNU General Public License (GPL)-2.0、LGPL等)[51]以致侵害了原告的财产和隐私权益;(2)违反了《千禧年数字著作权法》(Digital Millennium Copyright Act,简称DMCA)第1202条不得移除著作权管理信息(copyright management information,简称CMI)的规定;以及(3)违反了《加州消费者隐私法》(California Consumer Privacy Act)等。


一如预期,被告很快且首先就向法院提出了请求驳回全案的声请,主张原告无的放矢,没有提出任何实质性的内容。不过主审本案的乔恩‧蒂卡尔(Jon S. Tigar)法官于2023年5月11日签发的命令没有全部接受,除了发回让原告修正起诉书当中少数几个次要的主张和内容外,基本上维持了原告诉讼最重要的两个主张 — 违法移除著作权管理信息和违反使用许可协议,也就意味著全案必须持续,下一步将进入到发现(discovery,或证据开示)与庭审程序。[52]


(七)端倪、问题与挑战


由于上述的案件目前都还在诉讼程序的初步阶段,所以完全无法逆料未来的陪审团认定与法院的最终判决将会如何。不过既有的发展已透露出了若干端倪:


(一)这几个诉讼都可被视为“测试案件”,一旦后续的发展对原告(权利人)方面有利,势将会导致产生更多相类的诉讼,所以目前所见还可能只是冰山一角;


(二)之所以有这些诉讼发生的主要可能原因之一是,固然从既有的研究和文献已可大致推知几个人工智能模型开发的大致取向,但是这些企业在实际从事相关的机器学习过程终究竟是如何操作至今几乎完全还是所谓的“黑箱作业”(black-box operations),外界难以知悉;也正因过程的不公开与不透明极大程度加深了外界的疑虑甚至惶恐;


(三)只要当事人未在审前和解,通过发现程序(尤其是其中的口头询答(deposition))或可揭开从事人工智能开发企业的面纱,让社会各界有机会一窥其幕后的具体实操过程和内容。对于被告而言,这意味著极大的风险导致原本被其视为重要的商业秘密(是否的确符合法定商业秘密的要件自然还需法院认定)可能会全部或一部曝光,因此寓含了高度的不确定和风险;


(四)除了诉讼本身,整个态势几乎注定会让被告陷入两难。如果提前和解,不啻邀请更多人后续起诉,让其他人认为有机可乘,可借此狠咬一口,也就意味著将对未来的人工智能开发带来更多的风险与诉讼和赔偿成本,让这个原本已经非常“烧钱”的领域门槛更高,影响到后续的资金等资源投入与创新的意愿和成本;反之,如果坚持到底,绝不妥协和解,如前所述,就意味著其相关的具体操作恐怕有不少内容将会公开,让更多的人或厂家可以“搭便车”,与其从事竞争,所以无论如何都会非常的困难。


另外至少还会衍生出一个会影响到未来人工智能发展的问题:究竟应由谁或哪些人承担负责?如果法院最终判认由人工智能生成的物件构成侵权,即便使用者未必知悉最终的生成内容(尤其是细节)会是如何,但毕竟整个生成是根据使用者给予的“提示”所形成,也就如同提供了一个“框架”和“纲要”,而且是真正的行为人。那么人工智能的使用者是否应构成共同或间接侵权,连带承担全部或部分的责任?目前还没有针对性的司法判例给予一个明确的答案,所以也还是一个灰色地带。


之所以提出这个问题,是因为人工智能开发者很可能会提出一个抗辩:整个人工智能系统纯粹只是个辅助工具,完全是被动的,因此其开发者根本不是行为人。如果的确发生了如何的侵权责任,那也应当由真正的行为人来承担,毕竟那才是把生成结果搭配其自己的要求(也许又做了什么修饰)作为其呈现或表述的方式,人工智能并没有任何的“共谋”或“错误”存在。换句话说,纵使是一把枪,其存在的本身并没有任何问题,而是持枪扣动扳机伤害了他人的行为者才需要承担相应的责任。


依据美国司法既往的实践,即便终端使用者需要承担直接侵权责任,作为提供辅助工具的人工智能开发者恐怕无法排除也有可能(至少潜在的)要承担间接侵权责任的风险,尤其是所谓的“辅助侵权责任”(contributory liability)与“代理侵权责任”(vicarious liability)。[53]前者是指,即使没有直接从事或参与侵权行为,如明知或应知其所提供的装置、器材、工具、仪器等等会导致或在实质程度上促成他人的著作侵权行为,亦需承担相应的“辅助侵权”责任(在立法政策上与刑事上的“帮助犯”概念类似,并相互对应);后者是指,即使没有直接从事或参与侵权行为,如对构成侵权的行为负有监管的权力与义务,并直接从侵权活动获得了财物利益,也必需承担“代理侵权责任”(最常见于雇用关系,雇主必须为雇员的侵权行为负连带责任)。[54]在上述的“安德森等诉稳定迭代人工智能”案,原告便试图以代理侵权责任作为一个主要的诉求。前已提及,由于使用者对于人工智能经其提示后所生成的文档或物件是否复制了他人的作品既可能是一无所知,也可能完全无法从中取用控制,因此在侵权责任的承担分析上势将更具挑战性。


此外,这些案件和前述的“德雷克和威肯仿真歌曲”或是“AI孙燕姿”等还突出了另一个问题:人工智能依照特定作者的“风格”(in the style of)所生成的表述(无论是文字、图像、声音(音乐歌曲)等等或其组合)是否构成侵权(或称为“模仿”、“模拟”、“仿真”、“克隆”(cloning)等等)?如果答案为肯定,被模仿的当事人应如何主张什么权利、其范围应当如何?


如果被仿或受害的当事人想对此以著作侵权来维权,势将捉襟见肘,因为他(她)并未涉及对该特定生成物的创作,所以只要仿真生成物没有复制任何该当事人先前的作品或是完全从公共领域获得与该当事人身份识别相关的采样,被仿或受害的当事人基本上就无法主张任何的著作“侵权”,而需通过其他的路径寻求救济。[55]由此可见,此处实际上主要涉及到的并非著作侵权,而是侵害了所谓“公开权”(right of publicity,亦可译为“知名权”,类似于国内所称的“商品化权”)的问题。“公开权”是指任何个人对其身份识别的控制权,即排除他人未经许可对其身份识别从事商业性的利用,无论是姓名、肖像、声音抑或其他的身份标记(indicia of identity)。[56]目前即使在美国也还没有经联邦认可、能统一适用于全美各地的公开权。所幸如加州和纽约州等几个可能在未来经常会出现这类诉讼的地区已有相当成熟的司法实践,因此还不至于陷入毫无法律救济的窘境,但已有呼声希望国会能早日立法,正式承认和建立在联邦层级的公开权。[57]


不过即使有了通行一致的公开权作为保护,如要对应和防制这类“蹭热点”的潜在不法行为,时机往往稍纵即逝,且经常不易追查到真正隐藏在幕后的直接侵权者,加上司法诉讼旷日持久、缓不济急,难以在第一时间做出快速、有效的处置(法院所能做到的是发布诉前禁令,但如果不能直接从源头封锁,就很容易形成类似“打地鼠”(whack-a-mole),难以禁绝;另基于尽量不对创新造成妨碍的考量,法院一般也不会倾向于直接封禁特定的人工智能设施或应用工具)。[58]即使能找到应负责任的对象,也不易获得适当、有效的救济(例如,侵权的实际来源可能是在南太平洋某岛屿上的服务器)。这也凸显了法律的局限性,无法做为唯一的解决方案,势必需要加上技术、管理与教育等方案形成一组相对完整的配套。


二、输出端


在输出端方面,人工智能的生成物是否可以获得著作权的保护,首先在相当程度上取决于《著作权法》当中对于可受保护的主体“作者资格”(authorship)究何所指?范围为何?对此,美国版权局和联邦地区法院于2023年分别提供了初步但相当一致的政策指引与司法判决。


10.png


(一)美国版权局的政策


美国版权局于2018年收到了目前已知在美国境内的首个人工智能生成的著作权登记申请。一位李查德‧塞勒(Stephen L. Thaler, 1950 -,见上图左)博士拟以他研发出的一套人工智能系统(称为“创作机器”(Creativity Machine))做为由该系统生成、名为“近访仙境之门”(A Recent Entrance to Paradise,见上图右)的视觉图像的“作者”。美国版权局在初审和复审阶段都核驳了这个申请。著作权复审委员会表示,美国著作权法要保护有独创性的作者将其作品附着于有形载体的表达。从《著作权法》的立法历史和理由以观,国会对于何谓“独创作品的作者资格”(original work of authorship)刻意留白未曾定义,是为了维持法院依著作权法规所建构、关于独创性的标准,其范围固然相当宽广,但并非没有限制。[59]既有的司法判例也已经一再表明,著作权法的“作者”必须是“自然人”。[60]

在另一个申请案,美国纽约的一位作家和软件开发者克丽丝蒂娜‧卡什塔诺娃(Kristina Kashtanova, 1985 -)女士运用Midjourney人工智能软件“协作”完成了一个称为《曙光号的查莉娅》(Zarya of the Dawn)漫画作品(见下图),继而向美国版权局提出申请并获得著作权登记。当时她没有披露其漫画中的所有图画都是由人工智能所生成。后来美国版权局在获悉此一信息后,最终决定变更她的著作权登记:凡是该作品当中的文字表述以及对文字和视觉元素的筛选、协调和安排等部份可获得著作权保护,其作者(权利人)为卡什塔诺娃女士。但凡是由作者通过Midjourney人工智能软件生成的图像,虽然是经过作者的提示而来,但终非自然人的创作(non-human authorship),因此无法获得著作权保护。[61]



克丽丝蒂娜‧卡什塔诺娃(来源:《华尔街日报》)


美国版权局并表示,虽然人工智能生成的图样是根据使用者的提示而来,但不受使用者的控制,因为完全无法预期最终的成像会是如何。换句话说,所有由人工智能生成的图像虽然受到自然人的影响,终究不是由自然人创作,因为人类无法指使其最终的生成结果。对于这个修正裁定,申请人没有提出上诉。


美国版权局美国版权局一直以来都是采取此一政策立场,只对属于自然人的独创表达允许著作权登记(著作权是创作发生,不以注册登记为要件,但如在美国登记著作权,可享有多个维权和举证上的便利)。[62]该局于2021年对其《美国版权局实践汇编》(即审查指南,属于该局的内部规章,除非被法院援引做为判决依据,不具法律效力,但有极大的影响力)的更新,又特别加上了一段文句:“对于没有任何从自然人作者的创意输入或介入,由机器制作或仅从机械程序的随机或自动操作,本局将不给予登记。关键问题是,究竟‘作品’基本上是一个自然人身份的创作,仅以计算机(电脑或其他装置)做为辅助性的工具,抑或传统上做为成立具有作品作者资格的要素(对文学、艺术、或音乐性的表达或是筛选、组织安排等)实际上不是由人而是由一个机器所孕育和执行。”[63]所以两个申请案件分别遭到拒绝可以说并不意外。


由于这两个申请案,加上2022年11月30日ChatGPT的推出在全球引起了极大的轰动和人们的关注,美国版权局于2023年3月10日又出台了一个针对涉及人工智能生成内容的著作权登记政策指导,延续了只有自然人才具备作者资格的基本原则。[64]其中包括 —


(1)著作权登记的申请人必须通过“标准申请”(Standard Application)程序提出申请(简易表格不适用),并有义务在申请表格的“作者创作”(Author Created)栏目披露属于自然人作者的贡献部份、其作品是否包含由人工智能系统的协同生成以及对该生成内容的具体表述。


(2)只有自然人作者自身的独创表达可获得著作权的登记与保护。因此在申请表格当中应表明作品的哪些部份是属于自然人的创作;如果是在同个作品中对于人类与非人类的创作从事了创意性的安排,则应在“作者创作”的栏目内分别表示哪些内容是由自然人、又有哪些是通过人工智能“筛选、协调及安排”。如无法确定,可简单填写“本作品包含人工智能的生成物”。


(3)凡是通过人工智能系统的操作和生成,任何超过微量或最低限度产生的结果都必须明确排除在著作权登记申请的范围之外。


(4)如申请人不确定,可以用一般陈述的方式填写表格。如有不实陈述(包括故意省略),将面临权利被取消(无效)及其他潜在的后果。


由此可见,美国版权局在现阶段其实没有全盘否定所有涉及人工智能生成“作品”的著作权。在出台此一政策指导声明后不到一周,版权局宣布启动了一个“人工智能倡议”(Artificial Intelligence Initiative),拟全面检视使用人工智能创作成果的著作权范围(包括可版权性copyrightability)以及使用了他人受著作权保护的作品从事对人工智能系统的深度学习等问题。在具体的做法上将举行一系列的“公共聆听会”(public listening sessions),分别就人工智能对文学作品、视觉艺术、视听作品以及音乐和录音作品的影响、互动关系与各界人士进行探讨。[65]


(二)司法实践与发展


另一方面,之前遭到美国版权局驳回申请的塞勒不服,向哥伦比亚特区联邦地区法院(U.S. District Court for the District of Columbia)起诉,成为美国司法审理人工智能生成物是否可以获得著作权保护的首宗案件。[66]主审本案的贝丽尔‧豪威尔(Beryl A. Howell)法官于2023年8月18日以迳行判决(summary judgment)的方式完全支持了版权局的立场,塞勒败诉。[67]不过他通过律师已表示将继续上诉到联邦巡回上诉法院。[68]


法院首先表明,由于本案是对著作权登记复审的再审查,其角色形同上诉法院,因此所要审理的完全是法律问题,不涉及到对于案件事实的重新认定。因此可由法院以迳行判决来处置。[69]法院接著指出,本案的关键问题只有一个,即,由计算机或电脑自动生成的物件是否在形成时即应受到著作权法的保护?当版权局以没有任何人为因素的介入,因此也从不具有著作权为由,拒绝了申请人(原告)的登记申请时,法院所要审视的,是该局做成此一行政裁定的审查过程是否有“恣意妄为”(arbitrary or capricious)的情事或其他违反联邦《行政程序法》(Administrative Procedure Act)所要求的标准。法院认为版权局的裁定并非“恣意妄为”的结果,因为美国《著作权法》只保护由人类创作的作品。


法院进一步申论,诚如申请人所指出,《著作权法》从一开始就具备了很大的可塑性(malleability),能随著各种科技的发展与时俱进。但是在此种适应性的背后,则有个始终一贯的认知,即,著作权的核心乃是以人类创作为必要条件(human creativity is the sine qua non at the core of copyrightability),即使人类创作是通过新的工具或媒介来呈现。法院并援引了联邦最高法院于1884年对摄影师使用摄影机获得的相片可否获得著作权保护的经典判例来说明。[70]虽然一个摄影机表面上只是把在该装置之前的形象予以机械式的复制呈现,但终究是在摄影师对其相片应如何呈现首先形成了一个“心智概念”(mental conception)后,再从事各种背景的铺排、采光投影、当事人的服饰与摆出的姿态等等各种的设计与搭配。也就是人为因素的参与和终极控制作品的表达或呈现成为任何新型创作能否进入到著作权保护范围内的关键。


此外,法院也表示,从立法的历史背景和目的而言,虽然法律没有明文写出,但在认知上从一开始“作者资格”与“人类创作”便是同义词,即使著作权法历经了许多的演化和发展,这个基本概念仍然始终如一。国会历来对著作权法的修正也绝对从未显示有任何想要改变此一概念之处。反而是国会于1976年制定全新的《著作权法》时,明确要继续依循1909年《著作权法》的“作者资格的原创作品”(original work of authorship)标准,不做任何改变,因为著作权的立法主旨与核心价值是通过对人类创作的激励来促进科学与艺术的发展,非人类的参与并不需要任何的激励,自然也无须给予承诺赋权做为交换。[71]


法院另检视了既往的司法判例和实践,也确认了此一结论,即在欠缺自然人参与的情况下,所有的法院都拒绝承认享有著作权。例如,联邦第九巡回上诉法院在一个作者宣称是“受到天体神灵的指示所转述的话语”的著作侵权案件,依然判认作者可享有部份的著作权,因为纵使作者的宣称为真,由于该书是以信徒询问和“神灵”回答的方式呈现,显然其中有相当部份还是通过人为的创作发生,毕竟著作权法所要保护的是人类的创意,不是“神祇”的创作,因此仍可至少部份受到著作权的保护。[72]


法院在判决书中已然意识到人工智能对人类的创作会带来各种的挑战,并援引了国会议员给版权局和专利商标局局长的信函内容,但在本案的情形则认为形成判决是相对容易,因为就是保护的主体不适格的问题。


(三)争议与评论


在目前的国际公约框架下,虽然《保护文学和艺术作品伯尔尼公约》(Berne Convention for the Protection of Literary and Artistic Works)没有名确定义“作者”(author)或“作者资格”(authorship),据山姆·里基森(Sam Ricketson)教授的研究,在1967年制定该公约《斯德哥尔摩文本》(Stockholm Text)和1971年《巴黎文本》(Paris Act)的外交会议上,与会的各缔约国代表有个基本共识,即该公约的作者“当然”是指自然人而言,因此咸认不需还特别为此在文本中去定义。[73]

根据美国专利商标局于2020年进行的一项规模性调研和公共听证,在收到的反馈意见当中,绝大多数都认知并认同,在现行的著作权法框架下,除了因职务上的创作,非自然人在某些情况下可能成为著作权利人,无论如何作品的原始“作者”必须是自然人,亦即非自然人无法成为“作者”。他们也认为这个要求应继续做为著作权法的基础,因为著作权法的立法宗旨是以赋权做为交换,以期激励人们从事创作,人工智能毕竟如同过去被广泛应用的其他软件工具,当时就已在争论一个非人类的物件或程序是否能够具有“创意”,此次情况依然。[74]


有的评论指出,如果放弃了以“人类创作”为主轴的原则,或将导致产生许多难以逆料和有害的影响,不仅会对就业市场造成另一次的扰乱(著作权产业2021年的价值估计约为1,810.25万亿美元,占美国经济总值(国内生产总值(gross domestic product, GDP))的7.76%[75]),还会导致社会更加贫瘠,因为由人工智能生成的物件无论在表面上与出自人类的作品多么近似,终究欠缺人类艺术家的经验和情绪,……正是人类的经验让艺术成为每个社会当中极其重要的环节。[76]


也有少数的评论支持应对于没有人为介入、完全由人工智能生成、且具备足够创意的成果给予著作权保护,其权利应归属于人工智能系统的所有人/控制者或对其生成过程从事修整编辑,并完成最后表达形式的当事人或使用者。[77]


另有学者批判版权局的政策(也形同连带批判了联邦地区法院后续的判决),表示在运用人工智能的过程中,虽然是有,但多数并非仅以简短、含糊不明的提示来操作,因为这种方向不明确的指示经常会产生错误的结果,而每次的生成都需要一定成本的投入,所以总要尽量避免发生错误,节省成本。这也是为何当前一个新兴的专业(过去从未存在过)是“提示工程师”(prompt engineers),又称为“提示细语者”(