距离微软小娜(Cortana)2014年7月30日第一次在中国上线,已经过去三年。
在这三年里,从只能在微软的办公软件里看到它,再到其陆续入驻iOS与安卓平台,甚至开始接入车载音响、家电等第三方设备,你应该能发现,微软通过语音助手实施的“开放战略”也正在逐步确立并清晰起来。
就在昨天,小娜除了迎来自己的2.9版本更新(全新的界面展示与提醒清单,以及首次在iOS平台上添加锁屏插件功能),“小娜的爸爸”之一,也就是负责开发Cortana的微软中国团队leader幺宝刚正式向外界明确了微软的人工智能发展战略。不出意料,它一共包括了四个方向:
以人工智能助手为核心的产品化工作;把微软现有
应用变得更加智能化;把技术包装为平台开放给开发者;让云计算+AI融合地更加充分。
毫无疑问,作为微软发布的第一款AI语音应用,小娜排在了战略中的第一位;同时,它也是第一次被称为是“微软产品部门最重要以及需要付出最大努力的一个部分”。
微软小娜上线3年后, 除了将变身“音箱”, 也成为微软AI战略最重要的一环
在微软小娜三周年庆祝大会上,微软互联网工程院常务副院长,同时也是小娜开发团队负责人的幺宝刚讲述了小娜的“成长史”
在这3年里,获得了Windows用户好评的小娜,也想要“走出去”
如果从过去三年里小娜的实测效果与获得的口碑来看,它的开发的确受到了微软足够的重视:
在挑剔的知乎上,这款中文版语音助手基本零差评,而“中文语音识别率高”也成了小娜用户的“统一口径”;此外,它也在很多新媒体对诸多语音助手的
视频评测中获得了“碾压Siri”“比Google Now好一些”“微软小娜把Siri和Google Now怼的好惨”等正面评价。
以上网友评论节选自知乎
但很明显,正如网友的评论中所说,小娜仍然有很多不足。譬如方言的识别率,以及不能很好地通过上下文连贯性理解语义(现在语音助手基本都做不到),很多句式较长的问题它会直接跳转搜索网页等等。当然,这些问题不仅小娜有,其他语音助手也都逃不掉。
但最重要的一点,还是在于小娜由平台所限导致的功能被削弱的问题。
截止目前,大多数粉丝体会到的小娜的强大,都是基于自家Windows系统以及微软出品的Windows Phone。
正是由于与微软应用同属于一个生态系统,小娜能够整合进微软的系统底层,读取系统所有的应用权限及用户允许的隐私权限;
而相对应的,由于受其他系统条款与API限制,小娜读取的数据有限,不能充分依靠信息来判断操作者行为,因此在其他平台上发挥作用的余地有限。也正因为因此,被很多用户称赞为“吊炸天”的邮件追踪及分类功能,不可能出现在苹果与安卓手机中的小娜app中。
这就是为何,即便小娜早在2015年就进入了iOS与安卓系统(目前很多知名品牌安卓手机都有自己独立研发的语音助手),它留给这些平台用户的印象一直都更像一个聊天
机器人:
你只能查查天气,看个新闻,建个闹钟,跟她开个玩笑,与Windows里小娜的功能完全不能比。
当然,如果小娜仍然是作为微软卖Windows软件及自家硬件的一个附属品及亮点功能而存在,那么它的确取悦了Windows用户;但是,曾让苹果与微软迅速成长为科技巨头的“闭环”路线,绝对不适用于人工智能时代。
换句话说,人工智能脱离“界面”也能够长久存在,小娜需要做的应该是“无处不在”。
因此,在纳德拉上台后,微软也在软件生意的构想中改变了策略,先是将生产力软件推行到iOS和安卓渠道,力求打破各个体系间的隔膜。譬如,微软先后推出Mac和Android版的Office套装,再譬如发布全球第一款跨渠道的微软小娜;
另一项举措就是不遗余力地推广Azure云计算平台。
自2015年开始,微软在此平台基础上陆续并迅速开放了多个关于“认知服务”的API接口:
从搜索、知识管理能力,再到语言处理(譬如翻译),自然语言及语义的理解等能力,完全是在疯狂地招揽全球开发者(再看看近年来微软签署的各种各样的有关Azure的合作协议,频繁举办的Azure开发者活动与基于Azure的创新大赛,还有那微软财报上云服务的惊人收入,你就懂了)。
这样来看,作为微软人工智能战略中非常关键的一环,小娜这个语音助手,只有集成到更广阔的平台上,才能发挥自己的本土性优势。此外,按照微软的战略,小娜除了将在未来与更多微软服务相融合,也是微软拓展云服务的一个重要入口。因此,把它捆绑在一个相对狭小的自家平台上是非常不明智的。
但难点也恰恰在此——在一堆语音助手的夹缝里,以及在一堆喜欢自己做语音助手的移动设备上获得存在感其实很难。这就像幺宝刚告诉36氪的一样,虽然现在的数据很多很多,但是能够在其他平台及合作伙伴身上接触到数据,以及真正拥有这些数据,不是一件很容易的事情。
所以,掌握足够多的数据很重要,载体的选择也很重要。
隐私、权限、数据管理等问题,不仅限制了小娜的“成长”,也让更加广泛的合作与开放,如何走上商业化道路成为微软小娜必须接受和面对的事情。
小娜的下一步“变身”
与专注于吸引人气,能跟你闲聊瞎扯半小时的“妹妹”小冰不同,“姐姐”小娜显得更加正经和严肃,而且相对低调。根据幺宝刚团队对它的定位,小娜应该是一个帮你提高工作及生活效率的智能助手,实用性更强,一直以来对标的也是Alexa、Google Now 以及Siri等语音助手。
因此,让小娜来做智能硬件的内核,或许比插科打诨的小冰,更具备切入音箱、车载产品等垂直市场的需求条件。
所以重点就来了,小娜除了正在积极对接各种各样的第三方软平台(譬如可以让小娜帮你打开微信、饿了么等应用),其硬件产品形态的推出与商业化其实早已被微软提上的日程:
早在2015年,Satechi等蓝牙配件厂商就内置了小娜;
而在2016年初,小娜就随着Windows10一起进入了沃尔沃等部分品牌汽车的车载系统;
2017年初,日产等知名汽车制造商陆续宣布将联合微软小娜打造个性化车载语音助手系统;
在2017年5月举行的微软Build开发者大会上,关于小娜的爆炸性信息层出不穷——微软与音响顶级制造商哈曼卡顿联手开发的“Invoke”的智能音箱将于今年秋季发售,内核就是“小娜”(Cortana),而惠普也表示要生产由小娜驱动的硬件设备……
微软与哈曼合作的智能音箱产品将在2017年秋季上市
很显然,智能音箱,这个当下是个科技大公司都要插一脚(不插一脚都证明不了你是巨头……)的火热市场,是一个让小娜在未来显露头角的最佳载体选择。而幺宝刚也透露给36氪,按照微软近期的规划,让小娜产品化及商业化的途径正是以音箱及其他车载设备的形式来实现。
不过,从时间点来看,虽然小娜是较早切入语音助手市场的佼佼者,但微软智能音箱的“入场仪式”却举办的有些晚。但幺宝刚认为,这个市场目前还远没到成熟期,大家都处于准备阶段,再说,各家最终“拼”的是音箱的内核——语音助手质量的高低:
“微软在前三年积累了1.45亿规模的用户群体以及问答数据,这是个数据优势;另外,评估语音助手的能力,除了要算法好,其算力也要更强,训练模型的速度要更快。
我们有Azure这个平台,每一个服务器后面都部署了大量FPGA(这是一种硬件可重构的体系结构,常年来被用作专用芯片(ASIC)的小批量替代品,近年来在微软、百度等公司的数据中心被大规模部署,可同时提供强大的计算能力和足够的灵活性),这一方面可以说是占据绝对优势。”
虽然微软的竞争优势的确存在,但有一点仍需要我们注意:与竞争对手亚马逊的智能音箱Echo与Google的Google Home以及苹果的HomePod相比,微软的选择与百度的做法一致——不准备自己做音箱,而是把语音助手接入第三方硬件设备中(或许正是因为如此,微软音箱的曝光没有苹果与google发布音箱时的冲击力那么大)。
有意思的是,还记得去年百度在世界大会上宣布也要与哈曼打造一款内置了DurOS的智能音箱吗(今年也在大会上宣布与哈曼打造AI解决方案)?这就让人非常好奇哈曼面对两位重磅级合作伙伴,会在两家产品的制作中有什么个性化差异。
此外,还有一个由这种与第三方合作制造音箱所带来的疑虑值得我们思考:
无论是国外的Echo及Google Home,还是国内的天猫精灵及小米音箱,目前迅速推向市场的音箱设备基本都是各家自产的软硬合一的产品,而比阿里等公司更早宣布推出音箱的百度,却仍然没有拿出自己的正式产品,这是否是由于受限于第三方合作的关系呢?
但无论怎样,微软的“小娜音箱”总算是给出了一个上市的时间点,这一点倒是令全球的娜粉们值得期待;不过略显遗憾的是,这款在秋季发布的音箱还只是面对英文市场,而中文小娜音箱的上市时间,则仍然是一个未知数。