OpenAI:人工智能训练“不可能”避免版权数据

OpenAI本周向英国议会委员会大胆断言,如果不使用大量受版权保护的数据,就“不可能”开发出当今领先的人工智能系统,这引起了轩然大波。

该公司认为,像ChatGPT这样的先进人工智能工具需要如此广泛的培训,遵守版权法是完全行不通的。

OpenAI在书面证词中表示,在广泛的版权法和无处不在的受保护在线内容之间,“几乎所有类型的人类表达”都将成为训练数据的禁区。从新闻文章到论坛评论再到数字图像,几乎没有在线内容可以自由合法地使用。

OpenAI表示,在避免侵犯版权的同时创造有能力的人工智能的尝试将会失败:“将训练数据限制在一个多世纪前创作的公共领域书籍和图纸中……将无法提供满足当今公民需求的人工智能系统。”

虽然OpenAI为自己的做法辩护,但它承认,与出版商的合作和补偿计划可能是为了“支持和授权创作者”。但该公司没有表示打算大幅限制在线数据的收集,包括付费新闻和文学。

这一立场使OpenAI面临多起诉讼,包括《纽约时报》等媒体指控其侵犯版权。

尽管如此,OpenAI似乎不愿意从根本上改变其数据收集和训练过程——考虑到自我施加的版权限制将带来“不可能”的约束。相反,该公司希望依靠对合理使用许可的广泛解释,合法地利用大量受版权保护的数据。

随着先进的人工智能不断展示出模仿人类表达的不可思议的能力,法律专家预计,围绕被设计成吸收大量受保护的文本、媒体和其他创造性产出的系统的侵权行为,将展开激烈的法庭斗争。

目前,OpenAI正在反对版权最大化主义者,支持近乎无限的复制,以推动正在进行的人工智能开发。


作者:法瑞恩

链接:https://www.artificialintelligence-news.com/2024/01/09/openai-copyrighted-data-impossible-avoid-for-ai-training/

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

声明:海森大数据刊发或者转载此文只是出于传递、分享更多信息之目的,并不意味认同其观点或证实其描述。若有来源标注错误或侵犯了您的合法权益,请作者与本网联系,我们将及时更正、删除,谢谢。电话:15264513609,邮箱:1027830374@qq.com