现在,纽约时报对OpenAI关于“黑客入侵”的说法作出了回应,指责OpenAI歪曲事实,从而转移公众注意力。
“OpenAI错了,”纽约时报在一份法院文件中反复辩称,“OpenAI试图转移注意力的说法,即‘纽约时报黑了其产品’这种说辞毫无意义且站不住脚”。
此外,纽约时报在为其用提示引导ChatGPT吐出记忆(即训练数据,包括100多篇《纽约时报》文章)的策略辩护时指出,ChatGPT用户经常使用该工具生成整篇文章以绕过付费墙。
纽约时报辩称,他们目前并不知道有多少篇文章已经被用来训练GPT-3和OpenAI后续的AI模型,也不知道OpenAI使用了哪些特定文章,因为OpenAI“没有公开披露用于训练其人工智能模型的数据集构成”。
纽约时报强调,他们并不是为了提起诉讼,而是通过提示ChatGPT来发现证据,以试图追踪“该工具侵犯版权的全部范围”。
法院文件显示,为了弄清楚ChatGPT是否侵犯了某些文章的版权,纽约时报“通过向GPT-4提供《纽约时报》文章的开头几个单词或句子来引出其记忆的例子”。
OpenAI辩称,“在现实世界中,人们不会使用ChatGPT或任何其他OpenAI产品从付费墙后面的文章中生成精確的文本”,而纽约时报辩称“使用ChatGPT绕过付费墙”的行为已经“被广泛报道”。
纽约时报在法院文件中提到,“根据OpenAI的说法,《纽约时报》发现OpenAI盗窃了《纽约时报》自己的版权内容,从而犯下了不法行为”“OpenAI真正的不满并不是我们如何进行调查,而是调查揭露了什么:被告通过大规模复制《纽约时报》的内容来训练他们的产品——这是OpenAI既不承认也无法否认的事实。”
IT之家附前情提要:
2023年12月27日,纽约时报对OpenAI和微软发起诉讼,声称对方公司“未经授权而使用了数百万”文章来训练其AI模型,导致其AI“可以生成逐字背诵的《纽约时报》内容,对其进行总结并模仿其表达风格进行输出”,这“破坏了它与读者之间的关系”,同时也剥夺了其“订阅、许可、广告和附属收入”。
2024年1月7日,OpenAI针对《纽约时报》的侵权指控回应称:该机构一直在文章的开头提示GPT模型,导致模型产出的文本十分接近原文,从而增加了侵犯版权的可能性,可谓是“鼓励侵权”。
2024年1月17日,OpenAI阿尔特曼回应被《纽约时报》起诉:他们也不想用新闻出版商提供的训练数据,而且OpenAI正在与包括CNN、福克斯公司和时代周刊在内的出版商洽谈新闻内容授权事宜。
2月28日,OpenAI要求美联邦法官驳回《纽约时报》对其提起的部分版权诉讼,声称《纽约时报》黑入了ChatGPT等AI系统,为此前的诉讼生成了“具有误导性”的证据。