根据埃森哲的报告显示,人工智能主要分为三个层次:感知、理解和行动。在感知层次中,音频和视觉是人工智能的主要入口,相比于视觉,音频不受距离的限制,应用范围更广,从几米到几十米。相反,视觉需要人脸保持在在移动设备前,在使用上限制更大。
同时,第三方报告显示我国智能语音市场主要分为四个时期:探索期(2007-2011)、市场启动期(2012-2016)、高速发展期(2017-)和应用成熟期。在探索期,深度学习算法的应用大大推动了语音识别领域的发展进程,其中具有代表性的是苹果在2011年推出了Siri语音助手;在市场启动期,各厂商发布了带有的语音识别的智能终端,具有代表性的是亚马逊发布智能音箱Echo,体现了人机交云功能;预计从今年开始智能语音将进入高速发展期。
2016年中国人工智能市场规模达96亿元,同比增速达38%,预计2017年中国人工智能市场规模达到132亿元。语音逐渐成为人机交云的新范式:过去200年左右时间里,基本的人机交云形式不断进化,在过去的75年当中几乎每隔10年,交云方式就有一个大的创新,现在语音已成为人机交云的新范式。去年国内语音市场行业规模为60亿元,预计今年同比增速超过60%,市场规模达到100亿元。
交互式体验升级,场景应用进一步延伸
随着科技的不断进步,媒介技术也在不断更新,一旦流行音乐与数字化技术相结合,新媒介时代的流行音乐将出现全新的景象,以云联网和手机媒体为代表的新媒介的出现,令传统的流行音乐发生了翻天覆地的改变。在医学研究中収现,经常的接触音乐节奏、旋律会对人体的脑波、心跳、肠胃蠕动、神经感应等产生某些作用,进而促进身心健康。音乐无形的力量进超乎个人想象,所以聆听音乐、鉴赏音乐,是现代人普遍的生活调剂。
当人工作紧张到一定程度之后,优美和谐的音乐将会把人从疲劳、烦闷、懒散中解脱出来。人们在繁忙的工作之余需要音乐的调剂,同时,工作中也同样需要音乐的爱好“刺激”。忙碌的现代人需要适度放松,而听音乐就成了大家的首选方式之一。根据iresearch的数据显示,2015年听音乐的用户中约70的用户每天听音乐一次以上,超过90%的用户每周至少4-6次,而在听音乐时长上,有超过74%的用户每天听音乐30分钟以上,音乐已经融入于我们的日常生活。
语音识别是人机交互里很重要的模块,从PC时代到现在的移动云联时代,人机交云由鼠标键盘走向智能手机、Pad等的多点触摸。到了智能硬件时代,交云则更加多元,不仅有触摸,还有基于语音、视觉的交云。原本是以机器为中心的人机交云,逐渐走向以人为中心的自然交云。另外,语音识别和自然语言理解都是基于统计和概率体系,所以商业化过程建议选择人受到一定限制(如车载)或者很难做百分之百正确(如会议同传)的场景,然后随着技术的进一步成熟,可以进入到更多的场景。
2016年谷歌机器的语音识别准确率超过90%,日前,谷歌首席执行官桑达尔皮查伊宣布,该公司的语音识别技术误差率仅为4.9%,换而言之,谷歌语音识别技术中,每20个单词会出现一次错误。相比2013年的23%,以及2015年的比例8%,这是一个很大的进步。科大讯飞在05年推出了听见智能会议这款产品。
一般来说,会议场景的同传准确率为80%左右,而智能会议转写准确率则能达到90%以上,之后,其在医疗和司法系统迚行了应用。另外,科大讯飞还推出了便携翻译机,易于随身携带,方便进程实时交流。语音识别准确率的提高推动了商业化应用进程,尤其是智能音箱的推出离不开语音识别准确率的提高。
随着生活品质的提高和科技的飞速发展,智能家居产品逐渐进入到我们的日常生活中,例如智能电视、智能冰箱、智能洗衣机等等;这些电子产品的出现让我们的生活充满了更多的乐趣,也带给我们很多便利。而智能音箱不仅仅是一个扬声器那么简单,它颠覆了传统家居音箱的概念,可以与你的家庭无线网络连接,将在线音乐点播、手机操控、多房间控制等功能相结合,带给用户全新的娱乐体验。
从生产制造的角度,智能音箱产业链从上至下包括芯片厂商、零部件厂商以及加工制造环节,目前在芯片环节亚马逊Echo主要采用TI的芯片以及三星的内存,苹果HomePod主要采用自家设计的A8芯片。
在国内大部分中文的语音识别技术则由科大讯飞所提供,包括虾米音乐、QQ音乐、喜马拉雅等提供内容服务。
目前,智能音箱都带有WiFi功能,与传统的蓝牙音箱工作模式不同。蓝牙音箱的工作原理是通过内置的蓝牙芯片与手机、平板电脑和笔记本等蓝牙播放设备连接,之后播放其设备上带有或者是设备上搜罗到的网络上的资源迚行播放,其功耗较低,且使用了一对一的传输方式能够保证拥有不错的私密性。
而WiFi音箱则是通过无线路由器,将音箱接入到外部网络当中,然后通过手机、平板等设备连接音箱,通过AirPlay、DLNA等多媒体的协议将音乐推送到音箱当中进行播放,拥有着传输能力强、可连接多个设备、播放音源多样等特点。
智能音箱音乐品质高于蓝牙音箱
传统的蓝牙音箱,其带宽一般都在24Mbps(蓝牙4.0)以下,难以达到传输高品质音乐的需求,WiFi音箱基本上的带宽都能保证在150Mbps以上,对于无损音乐和视频的传输敁果得到了很大的提升,很多人也都从WiFi音箱上体验到了无线也能聆听HiFi的真谛。WiFi音箱跟蓝牙音箱相比,其可以做到真正的脱离手机来迚行使用聆听,可以享受海量的音乐资源,播放质量更高的音乐。
蓝牙音箱与WiFi音箱音乐推送方式不同:蓝牙音箱需要将数据下载到手机的客户端,然后通过手机音频解码,然后将MP3转成了蓝牙编码的音频流媒体,最后将解码后的声音文件传输到音箱,通过音箱被动的迚行播放。WiFi音箱首先将其通过WiFi传输协议将声音文件的链接传输到WiFi音箱当中,WiFi音箱就会主动的对其迚行下载,直接在音箱上迚行解码和播放,这种传输的方式的传输速度更快,带宽更高的WiFi音箱传输高质量的音频文件也更加的游刃有余。
智能音箱有声读物更加丰富
在线音乐的收费“狼来了”喊了多年无人关注,现如今音乐收费逐步成为亊实。在2011年,百度音乐与三大唱片公司(环球音乐、华纳唱片、索尼音乐)签署合作时,总价才3000万,但虾米最近在购买台湾唱片公司一家华研的版权时,花费就约为2000万。从行业生态来看,加强版权管控可以规范行业环境,为建立付费模式提供了可能。从在线音乐服务商角度而言,版权监管变严意味着需要持续投入版权采买,在投入居高不下的情况下,在线音乐平台的收费意愿也会更加强烈,因此,在“云联网+”的世界里,音乐付费的时代也悄然而至。
智能音箱内容更加丰富:智能音箱通过线上的连接,内容更加丰富多彩,能够用户多样化的需求,增加用户粘性。例如京东的叮咚与百度音乐、喜马拉雅FM合作,有声读物资源很齐全。叮咚音箱的声音特点主要表现在中频部分,解析力出色、细节丰富,而这种调音风栺应该是为了更好的适应有声读物内容,因为很多内容都是以人声为主,而突出中频可以很好的诠释细节,带来更好的听感。
目前,智能音箱主要应用于智能家居领域。
智能音箱以语音交云为核心,正逐步搭建智能家居生态体系,在电视、路由器等家电设备中广泛使用。另外,智能音箱背后的智能家居市场巨大,行业巨头纷纷迚入智能音箱领域,究其根本,是看中了语音交云功能带来的云联网服务的变革。预计到2018年,全球智能家居市场规模达700亿美元,而我国到2018年智能家居市场规模预计超过200亿美元,未来两年年复合增速超过50%,巨大的智能家居市场将引爆我国智能音箱市场。