广受欢迎的人工智能聊天机器人ChatGPT的开发商OpenAI已要求旧金山联邦法院驳回包括喜剧演员莎拉・西尔弗曼(Sarah Silverman)在内的作家提起的两起诉讼的部分指控,后者指控该公司侵犯了他们的版权。
这起诉讼源于今年夏天,两个不同的作家团体对OpenAI提出集体诉讼,指控OpenAI非法将他们的书籍纳入用于训练ChatGPT的数据集中。他们认为,这种行为构成了他们的书籍的“衍生作品”,从而间接侵犯了他们的版权。
然而,OpenAI在周一的回应中表示,ChatGPT生成的文本并没有侵犯作家们的书籍的权利。他们辩称,作者未能证明ChatGPT的输出与他们的作品足够相似,因此无法证明侵犯版权。OpenAI还要求法院驳回作家们基于州法和数字千年版权法提出的相关指控。
在这两起诉讼中,其中一起诉讼还包括对Meta Platforms(原Facebook)的指控。其他作家也针对谷歌、微软和Stability AI等公司提出了类似的诉讼。
西尔弗曼和其他作家认为,由于OpenAI在训练ChatGPT的过程中使用了他们的书籍,而没有获得他们的许可,这违反了版权法。他们还声称,这种使用导致他们的作品被数字化千年版权法(DMCA)所禁止的设备“反向工程”,从而侵犯了他们的权利。
然而,OpenAI的律师在回应中表示,这些指控“没有任何根据”,并且“完全不符合DMCA和相关州法的规定”。他们强调,OpenAI并未侵犯任何版权,并且没有使用任何受版权保护的数据来训练其模型。
OpenAI认为,这些诉讼主要是基于一种误解,即他们使用了实际的文本数据来训练ChatGPT。实际上,该公司表示,他们使用的是一种名为“文本八叉树”的数据结构,这种结构是基于语言的统计模型,而非具体的文本内容。
如果OpenAI能够成功地为其辩解,那么这将对未来AI工具的发展产生积极的影响。尽管OpenAI要求法院驳回部分指控,但该诉讼仍在进行中。西尔弗曼和其他作家可能会对OpenAI的回应提出反驳,并继续追求他们的主张。
无论如何,这是一个需要密切关注的问题。随着人工智能技术的不断发展,如何保护版权和平衡创新与利益将成为我们必须面对的重要挑战。
与此同时,这也提醒了所有使用人工智能技术的公司,必须密切关注其数据集的来源和使用方式,确保符合相关的法律和道德规范。尽管人工智能带来了许多机遇,但我们也必须同时考虑到其可能带来的风险和挑战。