财联社7月6日讯(编辑 牛占林)近日,两位美国作家对ChatGPT母公司OpenAI提起诉讼,声称OpenAI在没有获得版权授权的情况下,就利用他们的作品来训练其人工智能。
(起诉书)
起诉书中提到,美国马萨诸塞州作家保罗·特伦布莱和莫娜·阿瓦德表示,ChatGPT未经他们同意,直接复制了书籍的数据来进行训练,这侵犯了作者的版权。
特伦布莱的作品有《世界尽头的小屋》,阿瓦德的代表作为《看待胖女孩的13种方式》和《兔子》。
(资料图片仅供参考)
这两位作家称,ChatGPT写出的书籍简要,和他们发表的文章一模一样,这说明训练ChatGPT的数据库,是包含了他们的作品的。
聊天机器人是在大量的文本数据上进行训练的,OpenAI没有透露训练ChatGPT具体使用了哪些数据,但该公司表示,它通常会抓取网络数据,包括使用档案图书和维基百科等。
书籍是训练人工智能的理想选择,因为它们往往包含“高质量、精心编辑的长篇文章”,储存了人类思想的精华。
根据起诉书显示,OpenAI的训练数据超过30万本书,其中包括本就备受争议、版权归属不明晰的“影子图书馆”。
但要证明ChatGPT是如何以及在哪里收集到这些信息的,以及这些作者是否遭受了经济损失,可能是一个挑战。因为ChatGPT也利用了大量的互联网信息进行训练,包括互联网用户对这些书的讨论。
该诉讼代表美国全国范围内的版权所有者,寻求一笔数额不详的赔偿金。目前,OpenAI的代表没有对此事进行回应。
萨塞克斯大学知识产权法专业的ndres Guadamuz表示,这是针对ChatGPT的第一起涉及版权的诉讼。他补充说,这起诉讼将探讨生成式人工智能领域“合法性边界”的问题。
而就在几天之前,OpenAI在加利福尼亚州同样被多方提起集体诉讼,起诉书称OpenAI在未经允许的前提下,在互联网上窃取和挪用了大量私人数据来训练ChatGPT。