【网界】1月5日消息,随着ChatGPT这一生成式人工智能工具在全球范围内的持续升温,其背后所牵涉的训练材料知识产权问题也逐渐浮出水面,引发业界广泛关注。
据网界了解,OpenAI目前正与数十家出版商进行紧密的谈判,旨在获取他们的文章内容授权。此前,市场已有传闻称OpenAI在寻求大量的内容授权以支持其AI模型的训练,但此次公布的谈判规模显然超出了外界的预期。OpenAI的知识产权和内容主管汤姆·鲁宾表示:“我们与众多出版商都在进行积极且富有成效的谈判,他们已经看到了我们部分公开的交易成果,未来还将有更多合作达成。”
OpenAI最近与Politico的母公司Axel Springer SE签署了一项价值数千万美元的多年期许可协议,去年7月还与美联社达成了合作协议。这些知识产权交易对于OpenAI的未来发展具有举足轻重的意义,因为它需要在构建模型时平衡对更新、准确数据的需求与对数据来源日益严格的审查。
然而,有外媒报道称,部分参与谈判的媒体公司高管透露,OpenAI提出的年度授权费用仅在100万至500万美元之间,这对于即使是小型出版商来说也是一个相对较小的数字,可能会给双方达成协议带来困难。与此同时,苹果公司作为在生成式人工智能领域追赶OpenAI的竞争者,也在积极与出版商洽谈内容使用许可,并且据传其提供的资金条件要比OpenAI优厚得多。
另一方面,OpenAI目前正陷入与《纽约时报》的版权纠纷之中。上周,《纽约时报》对OpenAI和微软提起了诉讼,指控其在未经许可的情况下使用该报的文章内容。这起诉讼无疑对OpenAI的业务构成了严峻挑战。如果《纽约时报》胜诉,OpenAI可能将面临数十亿美元的赔偿以及被迫销毁所有训练数据的后果。这不仅将给OpenAI带来巨大的经济和工作负担,还可能对其与媒体行业的合作交易产生复杂影响。
鲁宾在回应这一诉讼时表示:“当前的情况与出版商过去在搜索引擎和社交媒体上所面临的情况有很大不同。在这里,内容是被用来训练模型的,而不是用来复制或取代原有内容的。”然而,《纽约时报》对此并不认同,他们坚称ChatGPT是在无偿抄袭其记者的作品。在诉讼中,《纽约时报》还展示了ChatGPT从其报纸上摘录整段文字的实例作为证据。这一纠纷无疑将给OpenAI未来的发展带来更多的不确定性和挑战。