[导读]语音识别之路漫漫,在发展的过程中还面临诸多难题……
随着科技的进步,我国已经迈入发展的新时代。大众创业、万众创新,在这个鼓励创新和进步的时代,人工智能受到了前所未有的关注、得到了广泛的应用,产生的影响也越来越大。
人工智能因何成名?
阿尔法狗与李世石的人机大战引起了广泛的争议和讨论,使得很多人开始关注人工智能。这类充满了噱头和趣味性的事件,满足了人们的猎奇心理,也掀开了人工智能的神秘面纱。
在传统的认知观念中,人们仿佛认定人工智能指的就是机器人。实际上,机器人只是人工智能所有应用中的一小部分。除了机器人之外,人工智能还包括机器视觉,指纹识别,人脸识别,视网膜识别,虹膜识别,掌纹识别,专家系统,自动规划,智能搜索,定理证明,博弈,自动程序设计,智能控制,机器人学,语言和图像理解,遗传编程等。由此可见,人工智能的实际应用领域是多么广泛。
语音识别大放光彩
就像世界上没有两片完全相同的树叶一样,每个人都有不同于他人的特点和个性,比如血型、骨骼、肤色等这些在生理上的表现 。其中较为明显的就是声音,任何两个人的声纹信息都是不同的。
还记得前段时间曾经引起热议和追捧的综艺《声临其境》,众多大咖如:韩雪、朱亚文、梅婷等,都以自己独特的声音塑造角色,用自己的声音魅力再现经典,引发了观众的共鸣。每个人的声音都各具特色,这也就展现出个体的差异性和声音的独特性。随着这档综艺节目的收视长虹,语音识别技术也悄然进入人们的视野。语音识别作为人工智能领域极具代表性的技术之一,在人们的智能生活中发挥的作用也越来越重要。这种智能科技能够提高我们的生活质量,为我们的生活提供有效的智能辅助,让我们的生活更加便利。
在智能家居生活中,语音识别技术可以应用于多个场景。包括声控灯、声控家具、声控多媒体、车载声纹系统等等。只要下达一句简单的口令,利用我们的声音就可以唤醒智能家居设备。例如:声控灯。以前家里客厅的灯总是要用手指触摸开关才能打开或者是关闭,而现在呢?只需要对着声控灯说出指令词,就可以开关灯,比起以前的确是方便了许多。
广泛应用语音识别
目前,多家手机产商加紧了在语音识别技术方面的布局速度。例如:LG设计的G7 ThinQ智能手机就应用了远场语音识别技术。5月4日,阿里确认全资收购北京先声互联科技有限公司(以下简称“先声互联”),后者是国内最早从事语音增强、远讲语音交互接口技术的团队,曾为阿里、百度、小米等多家公司提供远讲语音交互软硬件的解决方案。可见,国内高新科技企业对于语音识别布局的重视。
语音识别当中有一项重要的内容叫“远程识别”,意思是无论我们走到何地,通过声纹信息,都可以方便、快捷地实现身份识别。这种技术为金融、社保等领域的大规模身份识别活动创造了便利的条件。以前这些大规模的身份认证活动存在流动性大、审核困难的问题,代领、代签、冒认等行为难以杜绝。而语音识别技术有效地解决了这些问题,用户完全可以通过语音识别系统进行身份认证和远程识别。这就为我国全面推行实名制奠定了基础。
语音识别面临难题
随着语音识别技术的应用和推广,一些难题也逐渐显现出来。
识别率是衡量语音识别系统性能好坏的一个重要指标,在实际应用中,识别率主要受到以下几个因素的影响:
第一、背景噪音。如果所处的环境比较嘈杂,那么语音便会混沌不清,语音识别会受到周围周围环境的干扰。
第二、口语问题。人们在沟通交流时往往具有很大的随意性,并不完全符合语法和词汇使用的规范,有时也会随意颠倒语序,这对语义的分析和理解造成了重大的影响。而语音识别终究还是人和机器之间能够实现“人机对话”,就像是“人与人对话”一样自然和通畅。
此外,识别率还与说话人的性别、发音习惯、说话时间的长短等有关。
实时性是衡量语音识别系统性能好坏的另一个指标。对于具有高速运算能力的CPU和大容量存储器的PC而言,基本上能够满足实时性的要求;而对于资源有限的嵌入式系统来说,实时性几乎得不到保证。
语音识别之路漫漫,在发展的过程中还面临诸多难题,愿未来的人机互动能更加畅通,语音识别能够为人们的生活带来更多的便利!