会说人话因为咱有语气
这首先要先知道我们人类是怎么发音的。在每个词汇中,都会包含有大量的基础音,这点在我们最初学英语时已经有过很多的亲身体验。而这些基础音叠加在一起就会构成我们所说的复杂的语言。
Cortana的语言比我们更复杂
机器人能说话其实利用的便是这一原理。将这些基础音从语言样本中一一提取解析出来,然后打碎重新组合,形成新的目标的语言。这一过程我们可以考虑祖宗的活字印刷,只不过是活字变成了基础音。
Cortana的母语是英语,说英语的难度要小很多。在接收到语言文本以后,Cortana需要先利用计算语义学等逻辑对其进行分析,得知其语义。然后利用合成信号处理等将其解析出人声基础音。这样就可以发出一些简单的英文对话了。
让Cortana说中文,难度更大
那么问题来了,如果Cortana接收到的其他语种呢?我们中国用的可是汉语,Cortana也能说中国话,这是为什么呢?道理其实是类似的,Cortana会将一些英文的语义进行翻译,转换为中文,然后再以中文的基础音进行分析构建。
而如果Cortana遇到的新的问题,比如语音基础缺乏等问题,这时人工智能的力量就要发挥了。利用云端的匹配搜索,Cortana可以寻找相近的基础音进行取代和体会,当然有时这也并不足以解决问题,那就需要用到真人进行配音了。
强大的微软云给Cortana注入新动力
而在这个过程中,云技术会起到很大的影响,比如云存储、大规模计算和响应等多方面问题。但是这依然没有解决一个很重要的问题,很多机器人说话用的都是这个原理。那为什么Cortana说话会没有机器人味儿呢?
在这点Cortana表现的十分机智。Cortana会根据当前的对话情景进行情感分析,分析所采用的原理依然是万能的机器学习。然后利用当前情景的情感因素控制自己的语音和语调,也就会产生相应的语气。
Cortana也有小情绪
这点相信各位用户在使用过程中会有一定体验,比如Cortana道歉或者抱歉时,会选择很谦逊的语气,在回答你的问题时会采用很坚定的语气。这样语气的加入会使得原本冷冰冰的单词拼接变得更像人类的发音,这也是Cortana不同于其他机器人的地方。
不讲道理讲科研
当然,Cortana的竞争对手Siri 和Google Now也会采用这些技术。但是很多用户表示,还是Cortana的拟人程度会更高一些,这点的原因就不在Cortana身上了,而是在于其背后的微软研究院。
Cortana的比Siri说话更像人
微软研究院是一个怎样强大的存在,如果你有所了解一定会为其所震惊。微软作为世界上最强大的科技公司之一,微软研究院可谓是其最大创新依托。微软研究院与其他公司的创新中心不同,这里完全是一个学院派的作风。
如果谈到论文发表,你可能会想到各种高等院校,但是你知道吗?微软研究院所发表的论文数量一度排名全球第一,甚至超过最著名的麻省理工等高校。而微软研究院的甚至还会做出出版教材这种纯学术性事件。
更像科研机构的微软研究院
更为奇葩的一点,其他公司的创新中心员工的考核往往以绩效作为考核的标准,而微软研究院则是以论文发表的情况为考核标准。这根本就是个超级大学啊!微软研究院以这种类似科研机构的专业精神所打造的产品有着更好的表现也就不太奇怪了。
Cortana“叛变”了机器人语音,改成好好说人话。这绝不仅仅是技术上的小动作,其背后强大的科研支持才是Cortana越来越好的根源所在。而在这一点上,我国的科技巨头则需要更多的努力啦。