有些人认为,“你需要我所有的数据进行训练,我的数据非常有价值。”事实上,情况一般并非如此,例如我们并不想利用《纽约时报》的数据进行训练。
阿尔特曼还表示,公司的很多研究都是如何从少量、高质的数据中学习到更多东西。
在《纽约时报》起诉OpenAI和微软之后,OpenAI正在大力推动新闻内容的访问许可。彭博社上周曾援引知情人士消息称,OpenAI正在与包括CNN、福克斯公司和时代周刊在内的出版商洽谈新闻内容授权事宜。该公司的知识产权和内容主管此前告诉彭博社,公司正在进行数十项潜在的授权交易。
阿尔特曼这次透露了自己仍希望与出版商合作的意愿:“如果出版商愿意的话,我们希望能跟他们合作。例如当我们的用户询问‘今天达沃斯发生了什么’的时候,我们(的应用)就可以说,这是来自彭博社的一篇文章,这是来自《纽约时报》的一篇文章。有人愿意与我们合作,但有人不愿意。”
图源Pexels
IT之家附前情提要:
去年12月27日,《纽约时报》在曼哈顿联邦地区法院对OpenAI和微软发起诉讼,声称对方公司“未经授权而使用了数百万”文章来训练其AI模型,导致其AI生成的内容现在会与《纽约时报》的内容“直接竞争”。
纽约时报声称,为ChatGPT提供技术支持的大语言模型(LLM)“可以生成逐字背诵的《纽约时报》内容,对其进行总结并模仿其表达风格进行输出”,这“破坏了”它与读者之间的关系,同时也剥夺了其“订阅、许可、广告和附属收入”。