IT之家注意到,这项协议的达成正值各出版社、艺术家、作家和科技专家纷纷对生成式人工智能工具的开发公司提起诉讼或考虑采取法律行动之际,原因是这些生成式人工智能工具被指控在其训练数据中使用了他们的内容或作品。
OpenAI和施普林格的协议生效后,当用户向ChatGPT提问时,它将以来自Politico、Business Insider、Bild和Welt等媒体的新闻文章摘要作为回应。根据新闻稿,该聊天
机器人还将提供一些原本仅限于订阅者阅读的文章,并将在答案中“标注来源并链接到完整文章以保证透明度”。
该合作协议紧随OpenAI 7月份与美联社达成的协议,该协议允许OpenAI将美联社的新闻档案用作训练数据。
作为协议的一部分,施普林格将为OpenAI的大型语言模型(例如支持ChatGPT的AI模型GPT-4)提供其媒体品牌的内容作为其训练数据。
由超过2,200家出版商组成的贸易组织新闻媒体联盟(News Media Alliance)于今年10月发布的研究报告表明,用于训练热门人工智能模型的数据集“显著”更多地依赖于出版商内容,与通用网络内容相比,其比重范围从5倍多到近100倍。