自OpenAI推出生成式大语言模型ChatGPT以来,国内外生成式人工智能层出不穷。其中最引人关注的问题之一,莫过于人工智能生成内容(AIGC)是否具有版权?
“著作权保护对象是作品。”6月16日,在湖北武汉召开的第二届版权产业创新与知识产权保护东湖论坛上,中国知识产权法学研究会副会长、中南财经政法大学教授曹新明表示,某些人工智能生成物并非《中华人民共和国著作权法》(以下简称著作权法)意义上的作品。
曹新明解释道,著作权法意义上的作品应满足以下四个条件:由人类创作,具有独创性,是蕴含一定思想内容的表达形式,且不属于法律法规、通用数表、公式等著作权法排除对象。目前AIGC有三种形式,分别是完全由人工智能独立创作、由自然人辅助创作、按照自然人输入的提示词生成。
曹新明说,上述三种形式中,只有一种是人类直接参与的,这种情况下AIGC才可能具有版权。“在剩下两种形式下,将AIGC界定为‘作品’是有问题的。”这是因为人工智能并没有独立的思想,并不能独立地进行“创作”,更遑论具有版权。
南开大学法学院副院长、竞争法研究中心主任陈兵表示,从目前各国的立法状况来看,日本、澳大利亚、英国、美国等国家均未赋予人工智能民事主体资格,因此也谈不上AIGC“具有版权”。
虽然法律对AIGC版权问题的界定尚不明确,但仍应警惕生成式人工智能使用过程中的侵权风险,中国在此方面已有相关案例。陈兵说,在这些案例中,法院通过对AIGC的生成过程进行判断,明确对生成物是否赋予利益。这需要具体问题具体分析,但有一点可以明确:人类对AIGC的简单形式选择并不足以构成著作权法上的独创性。
生成式人工智能涉及从数据抓取到内容生成的全过程。这个过程中,作为生成式人工智能最终产品的AIGC在版权归属上界定模糊,其训练过程中抓取的数据也会有侵权的风险。
“现在人工智能里面有几千亿的元素、数据,其中很多都是受版权保护的资料。这部分资料版权所有者的权利该怎么保护,目前尚不明确。”曹新明说。
陈兵认为,目前国家知识产权局和深圳、上海等地已经开始着手研究数据的确权工作,但具体如何确权还需实践给出答案。“版权的设立是为了鼓励更多创新。”他表示,若不对数据和AIGC进行确权,会导致生成式人工智能开发商喂养成本过高,从而抑制创新。但另一方面,由于大模型具有显著的聚集效应和马太效应,人工智能开发商在训练人工智能时又极易产生数据垄断风险。
针对上述问题,陈兵认为,要理性对待AIGC创新,探索AIGC应用边界,优化对数据爬取的制度设计,分类分级探索场景化和精细化的算法治理机制,夯实算法开发者、应用者相应法律责任。“对于数据垄断风险,要发挥政府对市场的敏捷监管、精准监管作用,推动企业‘开源’发展,并确立多元监管机制。”陈兵同时表示。
此外,曹新明提醒,生成式人工智能可能不止会侵犯版权。例如,未经他人允许使用人工智能模仿其声音、动作、姿势、手势,甚至使用人工智能“盗脸”,就侵犯了公民人格权。
“针对这些问题,可选择安装‘护栏技术’对人工智能予以约束,同时应避免大模型受到某些用户攻击。”曹新明表示。(实习记者 裴宸纬 本报记者 吴纯新)