(记者 张素)记者17日从清华大学人工智能研究院获悉,该院联合RealAI研发并推出“新冠肺炎疫情AI话题分析平台”,帮助用户随时“触手可得”疫情最新变化。
RealAI首席执行官田天表示,新冠肺炎疫情暴发以来,各大媒体网站、社交平台上关于疫情的话题热度持高涨。在此环境下,信息的高效传播成为重要诉求。一方面,相关部门需要全面了解公众对疫情的话题讨论,辅助决策优化的同时也利于开展引导工作;另一方面,公众亟需第一时间获得最权威、最实时、最准确的疫情动态。
分析称,互联网成为这次疫情主要的“信息源”平台,传播模式更是基于人手一机的“自媒体”,信息流不仅降低了大众获取信息的“信噪比”,更滋生出不同程度的谣言。
据介绍,“新冠肺炎疫情AI话题分析平台”通过对多渠道海量媒体信息进行自动抓取采集、识别分析,解决了传统信息检索过程中因消息源头繁杂、消息过多、检索意图不明确而产生的困扰。同时,基于大数据分析和AI建模,自动识别出近期热点话题、新闻追踪和话题导向、地区关注度变化,为用户第一时间推送全网话题最新动态,满足用户对疫情舆情监测的需求,为作出正确舆论引导提供分析依据。
记者注意到,该平台已正式上线“全国热门速递”内容板块,包括“全国热门话题”“热点地区排行”“实时热点话题排行”“最近三天热点排行”“官方发布消息”“关于热点话题的热点信息”等具体模块。该板块基于国家及各省市卫健委与官方媒体平台上的公开发布新闻,结合公众开云电子链接 兴趣,实时更新全网最近一天与最近三天的TOP10疫情话题热榜,多维度动态展示公众关注的热门话题与舆论趋势。
“疫情当下,不仅是信息本身值得关注,了解用户获取信息的习惯、缩短信息获取途径也是重要的工作。”田天说,希望以自身算法、优势技术为依托,从内容侧打造防疫战线,发挥信息战“疫”价值。
值得一提的是,在底层算法支持上,该平台基于清华大学人工智能研究院、计算机系推出的WarpLDA主题提取算法研发。基于蒙特卡洛EM算法,WarpLDA在访存效率、并行度方面相比传统的Gibbs采样算法更有优势,可用于上亿级别文本的主题提取。