所谓
机器人新闻写手(Robot Journalism或Automated Writing),其实是一个拟人化的说法,确切地说,是指运用算法对输入或搜集的数据自动进行加工处理,从而自动生成完整新闻报道的一整套计算机程序。与以往人工智能在传媒业的
应用不同,机器人新闻写手最大的特征就是新闻生产的完全自动化。除前期的技术开发外,在具体新闻写作过程中,人工的参与并不是新闻产品产出的关键和决定性环节,新闻生产的主体实现了由人向机器的转变。
机器人新闻写手最早在美国起步,其作为一种技术出现的时间不长,真正应用于传媒领域更是近几年的事。本文简要介绍国外机器人新闻写手的发展历程,包括技术的产生和演变、在媒体领域的应用情况以及未来的发展方向,并分享国外学界和传媒业界目前对这一技术现象所提出的主要问题和思考。
技术发展演变史
关于机器人写作的相关报道最早出现于2006年。当年3月起,信息供应商汤姆森金融公司开始运用电脑程序来替代财经记者,自动撰写经济和金融方面的新闻。汤姆森公司称,它的机器人记者可以在公司发布信息后的0.3秒内提取有效数据,并分析整合成为一篇报道。当时,这项技术创新在赢得惊叹的同时,更多引来的是一片质疑之声。一些业内人士批评称,“机器人写作的新闻无法发现程式化的信息发布背后的细微差别,当然也无法更深入地揭示数据背后的含义”。
如今,在自动化写作的技术开发领域,主要的竞争者包括美国伊利诺伊州的叙述科学公司(Narrative Science),北卡罗来纳州的自动化洞察力公司(Automated Insights),以及总部设在美国得克萨斯州的一家欧洲公司Yseop。下面就让我们以叙述科学公司为例,回顾一下机器人写手技术的发展演变史。
2009年,美国西北大学开发了一个名为“Stats Monkey”的软件,利用此软件可以自动从网页中抓取大学棒球比赛的数据信息,并在12秒内生成一篇比赛报告。次年,这个软件的商业前景被发掘,两名西北大学的教授和一名前网络公司主管合作成立了叙述科学公司。
很快,叙述科学公司开发了一个名为Quill的系统,其最初的客户是美国十大联盟。这是一个以体育为核心的美国大学联盟。从2010年起,该软件撰写了“十大联盟”数千项大大小小体育赛事的新闻,它几乎是在比赛中进行实时报道,稿件不管是在数量还是时效上都远超以往。
成果是惊人的,不过问题也随之产生:由机器人自动撰写的新闻内容过于单一,常常是赞颂胜利者,批评失败者。客户对此提出要求,希望报道更加多样化,关注胜利者的同时也要关注失败者的表现并发现亮点。同样,在报道美国少年棒球联盟赛事时,家长们也要求报道尽量忽略失误而聚焦于正面信息。于是,设计者针对这些应用中发现的问题对软件进行了升级改造,使之更适应使用者的复杂需求。
为了更好地把数据通过算法转化成文字,叙述科学公司雇用了一批“元写手”,他们都是训练有素的记者,有自己一套成型的写作风格和手法。这些记者与工程师们一起“培训”计算机,使其能够从数据中发现各种各样的“角度”,并教会计算机如何组织文章的“架构”。为了组建句子,算法中还包括由“元写手”们汇总的相关分类报道的词汇库。此外,叙述科学公司的团队还为客户提供了报道语气风格的多样化选择,“可以是一名神经紧张的财经记者从交易大厅发出的尖叫型风格,也可以是卖弄学问的老学究讲课型风格”。
经过几年的发展,叙述科学公司的技术有了更强大的提升。2014年3月,该公司发布了Quill Engage平台,也就是谷歌分析(Google Analytics)应用。这是著名互联网公司谷歌为各种网站所有者提供的数据统计服务。这一应用的功能非常强大,只要在目标网站的页面上加入一段代码,就可以提供丰富详尽又简洁明了的图表式报告。它可以显示人们如何找到和浏览某个网站,以及网站所有者如何改善访问者的体验,提高网站投资回报率,如何在网上获取更多收益。它可以对整个网站的访问者进行跟踪,并能持续跟踪营销广告的效果,使网站管理者了解,哪些关键字真正起作用、哪些广告词最有效、访问者在转换过程中从何处退出等等。总之,这是一个全面的分析软件包,而它的主要功能就是由叙述科学公司的自动化写作平台完成的。
媒体应用典型案例
目前,就传统意义上的媒体新闻报道来说,机器人写手还主要应用于以数据为基础的程式化报道领域,如公司年报、股票市场简报、地震报道、体育报道等。例如,《福布斯》杂志早已开始大范围使用叙述科学公司的自动写稿程序,并专门在网站上设置了由此程序所生成新闻的网页;俄罗斯搜索引擎Yandex应用机器人撰写天气和交通报道;法国的《世界报》与Syllabs公司合作,在2015年的选举活动中,用机器人写手报道了数千条实时的各地选举情况。当然,媒体应用机器人新闻写手最为人们所熟知的,还要数美联社和《洛杉矶时报》。
2014年7月,美联社宣布,他们将使用自动化洞察力公司的写稿软件Wordsmith平台,自动撰写有关公司财报的新闻。美联社每个季度都会发布大约300篇此类新闻,此前,这类报道于人工来说是十分耗费时间的,而且记者编辑们在面对一堆数字时,出错也常常难以避免。相比之下,Wordsmith平台每秒最多可以产出2000篇此类新闻,而且出错率极低。今年10月,自动化洞察力公司公布了一份案例研究报告,详细介绍了这一平台是如何协助美联社每个季度撰写4300篇报道的。这个数字是美联社在采用机器人自动写稿之前此类报道人工发稿量的14倍。
美联社主编卢?费拉拉谈起使用机器人写手的感受时说:“在财报发布季,我们应该做的是以更具创造性的方式使用我们的精力和时间,而不是把大量时间花在发表财报和写概述上。我们以后要把所有美国公司的财报都让机器人来写。”她还表示,“任何数据驱动的领域,比如出口民意调查、天气等,我们都打算使用这个系统。”
与美联社不同的是,《洛杉矶时报》主要是在地震新闻和犯罪新闻领域应用“机器人写手”。2014年3月18日,美国加州发生4.1级地震,《洛杉矶时报》通过Quakebot生成系统,在收到美国地质勘探局电脑发出的地震信息后,自动将数据输入模板并提交采编系统,在3分钟内率先发布了地震报道。
《洛杉矶时报》在罪案新闻领域的机器人写手应用更具特色。2007年起,洛杉矶时报网站开辟了一个专门记录“杀人事件”的博客,初衷是 “力图记录本地区发生的每一起杀人事件”。然而,可以设想,这在以人力为基础的情况下几乎是不可能完成的任务。好在,2010年机器人写手开始接手这一工作。机器人写手不但报道新的事件,还追溯历史补上了之前几年漏掉的事件。从开设到2014年的7年间,该博客共发布了5000多起杀人事件的报道,详细记录了受害者的种族、性别、死因、发现地点等信息,而这其中绝大多数报道都是由机器人写手自动完成的。
未来的发展方向
机器人新闻写手出现至今还不到十年,真正开始成形并付诸实践只有短短的三四年。可以说,这一应用还处于初始阶段,未来还有无限可能,也许会远超我们的想象。不过就目前来看,有几个比较明显的发展趋势:
首先,机器人写手新闻在整个新闻报道中占据的份额会越来越大。关于这一点,应该不会有人怀疑。叙述科学公司的创建者克里斯蒂安?哈蒙德曾经预测,新闻报道将最终由机器人写手新闻所主导,份额将“超过90%”。不过,这一比例的得出是以机器人写手新闻本身创造了巨大数量的、从前传统新闻记者所不曾覆盖领域的报道为前提的。也就是说,一方面,由于机器人写手的加入,新闻的总体数量实现了几何倍数的增长;另一方面,今后我们的世界和我们的生活将日益数据化,越来越多的数据将在互联网上产生和流动,从而对自动化写作的新闻产生更大需求。
其次,质量日益提升,并将突破数据新闻的模式限制。众所周知,现在的机器人写手新闻主要限制在以数据统计为基础的报道模式,但技术研发者对于自己的产品有着更高的期待。他们称,下一步技术升级的目标就是使机器人写手新闻摆脱现在边缘化的状态,读懂那些无法用表格囊括的非数据信息,写出篇幅更长、内容更复杂的新闻报道,“甚至在20年或更短的时间内获得普利策新闻奖”。
再次,开辟更多报道领域,实现更广泛的应用。从技术出现伊始,自动化写作涉足的领域不断扩展,从最初的体育报道、财经报道,逐步扩展到自然灾害报道、罪案报道,之后还会进一步囊括健康咨询、调查报道等众多细分领域。除了新闻业,自动化写作未来更广泛的应用应该是在商业领域,如前面提到的谷歌分析应用,以及其他任何商业分析报告的生产方面,这一趋势目前已初见端倪。此外,在社交网站上,这一应用也大有作为,程序可以学习如何利用“病毒元素”撰写稿件,比如使用一些特定词语或句子结构,以使文章能在社交媒体上引起广泛的病毒式传播。
最后,更加个性化,面向个人用户。今年10月20日,自动化洞察力公司发布了Wordsmith平台面向公众的版本,个人可以注册测试版,正式的版本预计将于明年1月推出。这一应用可以帮助个人用户组织文字,一旦用户有了一个模板,之后需要做的就是更新数据,机器人写手会自动帮助用户生成文章。该公司CEO罗比?艾伦说,机器人写手并不一定要面向大众,它更像一个个人数据处理专家,对于每个客户来说,生成也许只有这一个人阅读的文章。未来,只要条件允许,每个人都可以拥有自己的机器人写手。
问题与思考
机器人写手是一项具革命性的新兴事物,在带来惊喜的同时,也引发了很多问题和思考。
首先,从宏观层面看,对于传媒业来说,机器人写手究竟意味着什么?曾经,有一些媒体从业者对这种报道形式嗤之以鼻,认为其过于固定化、模式化,将其称为“新闻”是对“新闻”这一概念的贬低和误解。然而,也有一些人持相反意见,认为这一技术是对新闻业的促进和发展。笔者倾向于后一种观点,即机器人写手的意义主要是正面的,它可以促进新闻业的拓展和深化。一方面,它的出现使新闻报道覆盖了传统新闻业没有覆盖或无力覆盖的领域,大大拓展了新闻产品的应用空间;另一方面,它对人工记者劳动力的解放,使后者可以将精力集中于新闻更深层次的挖掘和批判性分析思考,为新闻业整体的深化创造了条件。
不过,对于新闻从业者来说,危机也是显而易见的。“快,拔掉那机器人的电源!”这句戏言说出了传统新闻人的焦虑:机器人会抢走记者和编辑的饭碗吗?至少目前来看,答案还是否定的。虽然机器人记者大大突破了人工记者的工作局限,不管是在新闻产生的数量上还是时效上,都达到了人力所不能及的程度。但是,机器人写手与严格意义上“真正的记者”仍有较大差距,人类在创造性和行动性上的优势,仍是机器所无法比拟和替代的。人与机器不是竞争关系,而是分工合作关系。当然,这一变革对新闻从业者们也提出了更高标准和要求。
此外,机器人写手新闻在新闻伦理层面也为我们提出了很多新的课题。系统自动抓取的数据信息是否权威可信?会不会有人为操纵的可能?对这些数据,新闻机构是否已在法律上被授予使用权和发布权?哪些话题有可能在数据的输入中存在政治或社会偏见?机器人写手新闻会不会与人写新闻存在风格上的不统一而无法归入同一组报道中?如果某篇机器人写作的新闻中,其事实或逻辑受到读者的质疑,其他人能给出令人信服的解释吗?即使机器出错率很低,但是这种概率是存在的,那又由谁来监督机器,对它产出的报道进行查证?如果将机器人用于多媒体领域,它自动生成并发出的
图片报道、
视频报道是否能确保限定在法律规定的范畴内?如此种种问题,都会随着这一技术的不断进步而渐渐浮现,当然也可能会在人工智能与媒体越来越完美的融合中获得解答。
在不久的将来,新闻产业或许也会像制造产业一样,出现由人完成的“手工制作”产品和由机器人完成的“流水线作业”产品的划分。再或许,随着技术的不断成熟,人们可能会根本无法分辨机器人写的新闻和人写新闻的差别,或者早已接受或习惯前者,而认为这种区分毫无意义。工业革命使机器替代了人力,那么,新闻业也会有这样一天吗?技术革新的大潮不可阻挡,我们只能跟上变革的脚步,拥抱变革。