OpenAI:人工智能训练“不可能”避免版权数据

OpenAI本周向英国议会委员会大胆断言，如果不使用大量受版权保护的数据，就“不可能”开发出当今领先的人工智能系统，这引起了轩然大波。

该公司认为，像ChatGPT这样的先进人工智能工具需要如此广泛的培训，遵守版权法是完全行不通的。

OpenAI在书面证词中表示，在广泛的版权法和无处不在的受保护在线内容之间，“几乎所有类型的人类表达”都将成为训练数据的禁区。从新闻文章到论坛评论再到数字图像，几乎没有在线内容可以自由合法地使用。

OpenAI表示，在避免侵犯版权的同时创造有能力的人工智能的尝试将会失败:“将训练数据限制在一个多世纪前创作的公共领域书籍和图纸中……将无法提供满足当今公民需求的人工智能系统。”

虽然OpenAI为自己的做法辩护，但它承认，与出版商的合作和补偿计划可能是为了“支持和授权创作者”。但该公司没有表示打算大幅限制在线数据的收集，包括付费新闻和文学。

这一立场使OpenAI面临多起诉讼，包括《纽约时报》等媒体指控其侵犯版权。

尽管如此，OpenAI似乎不愿意从根本上改变其数据收集和训练过程——考虑到自我施加的版权限制将带来“不可能”的约束。相反，该公司希望依靠对合理使用许可的广泛解释，合法地利用大量受版权保护的数据。

随着先进的人工智能不断展示出模仿人类表达的不可思议的能力，法律专家预计，围绕被设计成吸收大量受保护的文本、媒体和其他创造性产出的系统的侵权行为，将展开激烈的法庭斗争。

目前，OpenAI正在反对版权最大化主义者，支持近乎无限的复制，以推动正在进行的人工智能开发。

作者：法瑞恩

著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

声明：海森大数据刊发或者转载此文只是出于传递、分享更多信息之目的，并不意味认同其观点或证实其描述。若有来源标注错误或侵犯了您的合法权益，请作者与本网联系，我们将及时更正、删除，谢谢。电话：15264513609，邮箱：1027830374@qq.com

2024-01-22 13:50:17

法瑞恩

行业新闻