目前,用户只需要输入一组数据,并附言“请使用这些数据写一份学术论文”,ChatGPT就能在几十秒内创作一篇可以假乱真的论文,这使得许多论文作者已经部分甚至全部使用ChatGPT来写论文。
不过,一些学术期刊和研究机构已经警告称,如果这些作者在提交时没有明确说明自己使用了ChatGPT,则构成抄袭或其他欺诈行为。
出于这个原因,检测文章是否是由AI生成的相关工具研发已经取得了进展,但到目前为止,还没有专门用于学术论文的检测工具。
堪萨斯大学的研究团队则专注于从“段落复杂性”和“常用短语”着手,训练一个新的AI来检验一篇论文是否由ChatGPT生成。
报道称,研究团队在截至2023年3月的半年内,从美国学术期刊《科学》杂志上选取了64篇论文,并让ChatGPT为论文生成300-400个字左右的摘要,最终生成了128篇由ChatGPT创作的文章,并被用于训练这个新的检测AI模型。
经过训练,该模型可以从AI生成的文章中100%识别出人工创作的部分,对文本中特定段落的识别准确率为92%,综合准确率达99%。相关成果已经发布在了《Cell Reports Physical Science》杂志上。
研究团队发现,ChatGPT很少使用“虽然……但是……(but、however、although)”这类表述。相反,它很喜欢使用“他人(others)、研究者(researchers)”等词语。
另一方面,人类更习惯将长句和短句交错使用,并且在句式上也与ChatGPT的惯用写法有所差异。
IT之家此前报道,美国得克萨斯农工大学的一位教授,曾通过向ChatGPT输入学生论文的方式来反向验证这些论文是否也是由ChatGPT生成,同样取得了不错的效果,直接导致半个班的学生挂科。