当你在百度搜索这个问题时,如今的搜索引擎已经可以智能地判断安吉丽娜·朱莉的老公叫布拉德·皮特,并直接告知你他是射手座的。省去了一整个搜索页面的信息筛选,也不必将这个问题拆分询问,搜索引擎俨然能像人一样思考,对问题解析、处理和组织,响
应用户的搜索请求并找到对应结果返回。而这其中每一个环节,都离不开人工智能领域最核心的技术——自然语言处理技术(NLP)。
用户在百度上搜索的内容千奇百怪,关键词组合的提问方式越来越少,直接用自然语言搜索已成为不少人的习惯,那么百度搜索必须听懂“人话”,理解用户意图才可以帮助其找到准确答案。而NLP技术的日臻成熟,使得搜索引擎能够充分理解用户的口语化表述,甚至可以联系上下文和场景,与用户进行多轮交互沟通。比如,当你搜索“林心如的老公是谁”后,直接询问“妹妹呢”,百度搜索便可以联系上下文,理解用户的问题为“林心如的妹妹是谁”,继而给出准确搜索结果。
除了自然语言处理,另一涉及人工智能的知识图谱技术也不断更新着用户的搜索体验。譬如,当你在百度搜索“关羽”时,你会发现下面出现了很多与关羽有关的三国人物,并且有灰色字样的注释,来阐释他们与关羽的关系。让人感到惊讶又有趣的是,关羽与貂蝉的关系竟然是“同乡”。
相关资料显示,当搜索引擎“学习”了海量的知识后,便可以构建起一个非常庞大的知识图谱。这样一个知识图谱里有上亿级别的实体(比如桌子、椅子、关羽),每一个实体有很多的属性(白色、木质、三国等)。一个实体可以跟很多实体有不同的关系,例如一个人可能跟很多不同的人有关系,同学关系、朋友关系等等,那么这时候搜索引擎便会构建起更复杂的网络,这个知识图谱的描述能力也将不断升级。目前,百度知识图谱里已挖掘了千亿级别的关系。
在知识图谱技术的基础上,通过知识挖掘,百度搜索便可以发现“关羽和貂蝉是同乡”这样不为人熟知的联系。当这个庞大的知识图谱经过扩充联想不断丰富后,其拥有的能力也将越来越强大。比如,“谢霆锋儿子的母亲的前夫的父亲”,这句话虽然听起来拗口,但是搜索引擎却可以把这一个一个的关系分析出来,得出搜索结果“谢贤”。
此外,借助用户建模以及数据挖掘等人工智能技术,百度搜索还能够“理解”人的情感,根据用户喜好进行个性化推荐。比如两个用户分别对动漫和快递感兴趣,那么当他们搜SF这两个字母的时候,他们想要找的东西是不一样的,百度搜索将根据个人的兴趣,推荐不同的内容。
在2016百度世界大会和G20峰会后,人工智能已然成为百度的最新标签。这家以搜索立身的科技公司不断在“人工智能+”领域带来惊喜,而用户最为熟悉的百度搜索,也凭借机器学习、数据挖掘、自然语言处理、语音、图像及用户建模等技术日渐智能化。如今的百度搜索,不仅能针对移动场景将搜索结果有机聚合,继而结构化呈现精准的信息内容,提升人们的信息获取效率,而且可以通过大数据技术描绘人的个体特征,在准确判断用户需求的基础上提供个性化信息服务。可以预想,当人工智能与搜索引擎的结合更为紧密时,“百度一下”将不仅是一次搜索过程,更像是一场与“人类”的沟通。