版权商准备和微软、谷歌、OpenAI打官司!训练AI模型,也得付钱?
AI聊天机器人凭借其出色的能力,成为环球市场的焦点,让互联网公司之间掀起了新一轮军备竞赛。
但是,用于训练人工智能的数据,如新闻、书籍等,许多都是有版权归属的,AI公司该为使用这些内容付费吗?
据媒体报道,近期,出版行业的高管,已经开始审查其内容在多大程度上被用于训练ChatGPT等AI聊天机器人,应该如何获得补偿,以及如何从法律上采取行动。
新闻媒体联盟 (News Media Alliance) 执行副总裁兼总法律顾问Danielle Coffey表示:
我们的内容有价值,是真正的人类辛苦劳动的成果,却不断被用来为其他人创造收入,我们必须得到补偿。
据知情人士向媒体透露,美国内容社区Reddit已经与微软就其内容在AI训练中的使用进行了商议。
此外,拥有《华尔街日报》、《纽约邮报》、《巴伦周刊》等媒体的美国新闻集团也正计划采取行动。
首席执行官Robert Thomson在最近的一次投资者会议上表示,他已经开始与某一方进行讨论。
Robert Thomson认为:
很明显,他们在使用独家内容——我们肯定该得到一些补偿。
除了出版商,图片作品的版权方也在向AIGC公司讨要授权费。今年2月,在线图库Getty Images已起诉AIGC领域独角兽Stability AI,称其侵犯了Getty Images的版权。
AI公司是否有权从互联网上抓取内容,并把这些数据输入他们的训练模型,是一项模糊不明的法律问题。
在中国、美国、日本、欧盟等地的法律中,均有合理使用条款,允许个人、公司在某些情况下未经许可使用受版权保护的材料。
许多AI公司也援引这一条款为自己申辩,但出版商则认为,大量使用受版权保护的内容训练AI,是对这一特许权利的滥用。
并且,人工智能工具可能会让他们的网站上损失流量和广告收入。在搜索引擎时代,用户还需要点进网页找资料,但现在,大部分时候,搭载GPT-4引擎的Bing都能直接帮你生成答案,几乎不需要再查阅网页。
此前,OpenAI首席执行官Sam Altman在谈到版权问题时表示,ChatGPT是根据两年前的数据进行训练的。他还表示,OpenAI也在积极和内容公司合作,获得授权,表示公司愿意为特定领域的高质量数据支付高价。
比如,去年,OpenAI与在线图库Shutterstock达成了协议,Shutterstock给OpenAI提供数据,OpenAI给Shutterstock提供技术。与此同时,Shutterstock还设立了一个基金,那些作品被用于AI训练的艺术家提供补偿。
现在的问题是,AI工具仍处于进入商业应用的早期,如果真的要让AI公司为大规模复制作品支付许可费用,在实践中也很难完成。对版权问题,整个行业还没有形成固定的准则。
我们此前提到,设计软件公司Adobe是解决AI版权问题的先行者。它在最近推出新工具"Firefly" (萤火虫) ,致力于让AI生成作品安全地商用,同时让艺术家自主选择,要不要把作品交给AI训练。Adobe希望能塑造行业的新标准,但这一切,都需要时间。