昨天下午看到王小川时,第一个感觉是他变得更清秀了。一位接近搜狗的人士告诉我,王小川在这几个月内“瘦了十几斤”。
昨天刚出的搜狐财报,在广告业务、在线游戏的一片亏损中,只有搜狗还在坚挺着相对平稳的增长趋势。2016年全年,搜狗营收44亿元人民币,同比增长19%,非美国会计准则下的净利润达6.4亿元人民币,根据最新汇率约合9300万美元,相比2015年1亿美元净利润,同比下滑7%。其中,2016年第四季度,搜狗营收11.7亿元人民币,同比增长11%。
去年中国的搜索市场上风波不断。“魏则西事件”后,对于搜索引擎内容推广是否应定性为广告的争议引起了广泛讨论。《互联网广告管理暂行办法》的出台不仅规范了搜索广告的定义,也对搜狗的利润造成了一定的影响。这是本季度有点下滑的主要原因。但王小川对下个季度的财报保持乐观的态度,认为会有一定的增长。
今年年初,微软“华人第一高管”陆奇空降百度,百度人工智能“小度”参加电视节目《最强大脑》也吸引了不少人的目光。与此同时,搜狗的人工智能“汪仔”也开始亮相在公众视野当中,第一站也是一个与人类争锋的电视节目--《一站到底》。
同处于搜索行业,王小川如何看待现在的百度与搜狗的区别?百度将人工智能定为核心战略,搜狗又达到了什么样的成就?推出英文搜索后,搜狗怎么进一步寻求搜索份额的突破?这些都成为了亟待王小川解答的疑问。
以下是搜狗CEO王小川与搜狗首席科学家许静芳在记者沟通会上的全文速记,我们疏通了一下文字,划了重点:
王小川:挺高兴有机会和大家面对面谈,有段时间我们和媒体没有亲密的接受任何一个这样的访问。回顾从2013年到2016年,13年搜狗与搜搜合并,到现在已经三年的时间。
我第一个感慨是,搜狗搜索活下来了,2013年合并时,360的一些言论,说中国搜索市场只能容纳两家,没有第三家的事情,表达第二家是他,现在看起来,在中国百度依然还是很大,此外搜狗是唯一一家既有PC搜索也有无线搜索,市场份额、收入利润在上升的公司。这也是我们活下来,而且不断地有更多竞争力的原因。2016年利润是6.4亿人民币,其中投入到很多领域去,在搜索行业算是活下来的。
具体看量,我们可以号称叫全球第三大搜索引擎,虽然只做中国市场,因为Google最大,百度第二,我们第三,从搜索量排是在第四,后面才是其他家引擎,想说量上中国市场是最大的,在国内第二,在全球排第三的位置。
2015年,我们发布了微信搜索和知乎搜索,2016年,我们发布了明医搜索和英文搜索,慢慢开始和百度走向不同的道路。大家用微信会用一些。我认为,医疗搜索和英文搜索是通向未来两个很重要,可以展开无限想象力的事情,通过微信搜索和知乎搜索基本固定了形态,在医疗往下出现自助诊断甚至分诊,能够让用户真正明明白白看医生。现在大家拿着化验单可能不知道什么意思,给你个诊断方向你不知道怎么办,或者发生头痛感冒不知道怎么办。这是借助大数据下,在AI分析里逐步走向辅助医生或者让用户和医生之间建立更多信任的工具。我们知道,国内之前有很多做医疗的创业公司,基本觉得把这个市场做坏了,把医院医生搞得很疲惫,因为大多数逻辑,是希望医生脱离医院出来在线做诊断,他要形成对用户的吸引力,也要建立后面的商业模式,这是原来的一点。
但是我们没有这个需求,因为我们本身有用户,用户需要解决诊断的问题。我看到一些医疗机构,大部分来讲,上不接用户,下不接医院,就是医院不是他的,用户也不是他的,在中间是没有竞争力,他想把医院拉到自己这边,吸引用户,医生是没有办法独立于医院的,这是之前创业者出现的问题。但是我们有用户,我们代表用户找到医院,找到医生,这样的模式能够真正有机会成立。而且我们在医疗上也没有创业公司赚钱的压力,因为对我们而言,只要用户认可搜狗搜索,有足够大的搜索量,搜狗搜索有良好的商业模式,只要量大,给用户搜索产品就行了,而其他创业公司会面临压力,第一是没用户,第二是基于资本压力创造赚钱的模式,这也使得搜索引擎公司在医疗服务里能找到自己更好的位置。
我会认为百度会变得更难,因为百度现在毕竟市场份额大,他会把广告模式转成免费为用户提供多种咨询的模式,收入会下滑,我们没有这方面的压力,这是关于医疗上的思考。
另外,我们从英文搜索走向海外搜索,这周内我们会有两个升级,一是英文搜索升级成海外搜索,最后搜索的结果也是用中文呈现,以前我们大家谈到的事情是,去年有几十个院士跑去给习近平写联名信,希望能对谷歌网开一面,如果科技工作人员不能用谷歌搜索海外科技信息,中国和世界是脱节的,国内的科技发展就会受制约,我们可以不看国外的美剧、韩剧,但在国外科技、信息层面不能落后。但我认为不够,即便开放的Google,但大部分人是用中文的,而世界上非常多有益的信息,包括医疗信息、科技信息,甚至大家言论上的讨论都发生在英语世界里。
在这种情况下,把英文变成中文以后,我相信,98%的中国Kaiyun官方网站app登录 能更好享受全球的内容,因为我们最强的是语言部分。正好这个时代到了,去年在AI爆发一年到年底时,翻译技术是突飞猛进的,比原来的翻译有快速的发展,就像语音和图像突破,翻译技术突破了。因此,我们有机会把翻译和搜索做一个联动,因此我们说搜索全世界。一个中文输进去我们现在开始搜索的是全球的英文,然后我们未来考虑把全球的日文或其他文字的信息都搜索到,这样会构成一个独有的竞争力,这是Google并不care的东西,因为英文是他们的母语。这种情况下,在翻译上更多是秀研究的肌肉,Google秀8国语言的互译,秀的是如果没有语料,没有中文到德文的,只有中文到英文,英文到德文,我是不是能做中文到德文的翻译,他们是在做这样的事情,和我们的目标不一样。我们是实实在在希望通过翻译技术把搜索做得更好,海外搜索也会成为搜索竞争中的差异化。
第一次从微信内容开始,我们开始和百度不一样,开始有了知乎、明医和海外,这周升级完之后就可以完全用中文完全浏览世界的网页,不仅是搜索的词用中文搜索,结果也用中文呈现,点出去的链接也全用中文来看,在一些场景里
应用也更加方便。我们内心对这个事情有蛮高的理想,先不说赚钱的问题,因为地球上中国人是最多的,但是我们很不幸,在200年来发生的变化,英语成为世界主要沟通的语言。这么大的人群和世界主要语言有隔阂,使得用中文搜索世界,我认为,对中国整个大的复兴、成为世界主旋律的一部分是有历史意义的,我们内部叫重写《通天塔》的故事。《通天塔》就是讲语言不通,使得各个国家的人没法联合起来做事情,语言通畅了之后会带来一个新文明,就像发明火、发明电一样,所以我们2016年在搜索做了很多的工作,从AI也是武装到牙齿。
去年有个很著名的AI媒体负责人跟我聊,中国现在有两家是在AI上最努力做报道的自媒体,其中一家问,搜狗要转型做AI了,我听了一肚子火。因为搜索其实就是AI,它就是让机器像人一样去思考,搜索引擎变得很聪明,能够帮我们选择出更好的页面来。陆奇刚刚去百度,放出一句话,说搜索是AI最好的场景,搜索和AI是天生在一块儿的。今天在做AI的很多公司,大规模做机器学习、深度学习方面,Kaiyun官方网站app登录 方面也都是找搜索公司去要人。因为有了深度学习之后,会使得搜索场景有更好的武器来满足,甚至升级这样的能力,而我们内部的员工大部分受过正统的训练,怎么用这种数据和方法,大家都知道怎么读论文去提升,我们没有Google或者DeepMind那种能力里面,属于开创出新的算法出来,但基于上面的算法去改良的能力是足够的。
AI里,我们在翻译里面是往前在走,输入法之前也是很容易地开始做语音输入、图像输入,我们现在语音输入量是全中国最大的,而且比其他家加起来还要多的份额,1天2亿多次语音识别请求。在AI时代里,大家的理解不只是语音和图像,AI里面最难的地方是人的思想和知识的学习,不仅是图像的识别,语音的识别,人最宝贵的不是图像和声音,人的难点在于知识的理解和推理能力,而这种能力是靠语言体系来支撑的,靠语言来支撑对知识和思考的表达。搜狗在这里面天生是两个场景,一是输入场景,让大家用语言表达,二是用语言获取信息。因此,我们在AI场景里细的分类是分在自然语言里,自然语言代表了对知识和思想在这里面的人工智能,这里面是人工智能最难的一块。
往下的思考是几个事儿,通过语言将搜索升级到对话系统、问答系统以及翻译系统,这是我们核心能力的三部分。包括《一站到底》,可以认为是搜索对未来的模式,就是提问题,不是给你10条链接,而是给你1个答案,实际上《一站到底》的场景相对比较窄,我们在问答处理能力上是比较宽泛的,不仅能找到实体,能在里面做更多的运算,《一站到底》是演示下一代技术中间的场景。对话系统也是今年的一个重心,翻译系统,我们会把这种能力不仅用到移动互联网,未来在智能硬件里也会大量地使用我们的一些能力。以自然语言为核心,我们做语音也是把它翻译成语言,语音识别是从语音到语言,合成是从语言回到语音,但处理的核心是语言,我们要把语言的能力,结合语音、图像和其他方式放到手机之外的硬件里。所以,我们AI的逻辑不仅是放在输入法和搜索里,产品形态里有几个关键词:输入法,搜索,自然语言的计算,自然的交互。他们支撑的地方是对话的问题,问答的问题以及翻译的问题。我们希望在这几个场景里,大家都能看到搜狗的声音,尤其硬件、IoT到来的时代,无处不在会有交互和机器智能,这是对未来的判断。
以上是搜狗过去所做的事情,以及往下对人工智能和业务发展方向的理解。
记者:川总,您刚才也提到,当百度把陆奇招过去这个事儿你怎么看?有压力吗?刚才你讲到搜狗这么多细分领域的技术,语音识别领域有科大讯飞等,感觉你进入的领域很多,竞争对手也有很多,这方面你是怎么来看的?
王小川:一来就提两个竞争的问题,一个看百度,一个看讯飞。首先陆奇,我比较多跟他打交道,搜狗之前做海外搜索,英文海外检索部分是和bing合作,也是和陆奇谈的。陆奇有两个很大的优点,一是技术理想主义,和他聊天能看到他一谈到新的算法就两眼放光,半夜两三点去读论文,是个很好的技术人。二是也不官僚,跟他谈东西,也不会摆在全球华人最高职位上,而是非常平易和我们去谈的。这是他的两个特质,对他蛮尊重的。
关于科大讯飞,我认为要明确,科大讯飞是to B的公司,基因是做企业的事情,我们是做toC的公司,是和消费者、网民能产生一种连接,大家基础的技术竞争力方向是不一样的。
搜狗的技术是全能力的技术,语音识别大家听科大讯飞比较多。但目前语音识别里,用户使用量最大的,是搜狗,远远大于科大讯飞,在输入法里已经用到了。做技术现在需要两件事儿,一是有数据,二是有研发AI的能力。数据能力上,我们是有优势的,研发能力我觉得搜狗也没有弱的地方,尤其深处北京。从我们的应用场景到数据积累、技术能力,我自己评估一下我们都占优势的位置。
去年我们已经开始领跑了,在乌镇大会上做同声传译。现在和搜索产品结合,也上线了fanyi.sogou.com或者translate,现在已经公开了。和讯飞的比较里已经不是关键问题,我们现在明确和两家公司作对比,一家百度,一家Google做对比,我们有信心比他们要好,直接线上能看的。无论是语音识别还是在线的翻译,我们都比他们好。而这几家我认为,讯飞发出来同声传译的系统来,其他家还没有。们是更早使用这个产品,发布的场面也是更加官方的(乌镇互联网大会),今年会有更多的场合会用到。马上就到十九大了,我们在更严肃场合是敢去用我们产品的,搜狗的语言和翻译已经处于领跑的位置。
记者:刚才听了王总的介绍说,海外搜索有升级,请问这里面有什么样的技术?
许静芳:5月份发了英文搜索,2017年1月份发的是由英文搜索升级为海外搜索,刚才川总介绍过,英文搜索的背景是,世界上有更多更好的优质信息在英文世界,中国用户因为各种各样的原因接触、触达到英文信息并没有那么便捷,所以我们和bing也有合作,在国内发了一款非常好的英文搜索。但大部分中国人在消费英文内容时比中文还是要困难一些,便捷性没那么强,速度没那么快。5月份上线时,我们就有一个功能,把中文query翻译成英文query再找英文结果。5月份魏泽西事件比较热,关于滑膜肉瘤,有很多医学的术语,你也不知道,中国的信息不一定全,不一定对,我想去看国外的。那问题来了,滑膜肉瘤怎么搜,怎么拼,很多用户是这样的反馈,一个常见的路径是先翻译后搜索。当时我们发布英文搜素时就有这样的功能,自动把query翻译成英文query。我们自己也发现,搜索中文结果非常快,扫一眼就知道哪条是你想要的,然后点开详细去阅读,当看到英文或不熟悉的领域时就会慢下来。
我们这次升级为海外搜索的时候,就希望把这套系统做成一个闭环,引用中文query翻译成英文query,搜到英文内容之后再翻译成中文结果。这是目前唯一商业系统能够把翻译和搜索真正结合起来的系统,翻译用的是搜狗神经翻译技术,在检索部分是搜狗和bing一起合作的。这里面会出现很多新的问题,查询词是很简短的,会有歧义,英文查询词还好。会发现,搜索结果出来以后,搜索结果有标题,有摘要,里面有很多省略和专有名词、细节去处理,包括很多开放域的翻译,十条结果一起翻译出来,内容宽广性和实时性上都提出了比较大的挑战。
王小川:我补充两个场景,用户也用在线翻译,在线翻译之前的品质是不够的,以前用起来翻译,觉得比我自己翻译的差,但现在发现机器比我翻译得好,这已经过了一个门槛,是很重要的变化,翻译的技术现在做到是能够可用了。第二,也有清晰使用的场景,我们两个场景在做,比较重点的是搜索里面去用。
记者:搜狗面临一个问题,不知道你输入时问题会面临各种各样的可能。
王小川:是的,第一让翻译可用,第二让翻译找到可用真正的场景,这件事情都是在全球首次做到的事情,以前在线翻译总觉得离人的使用始终是有距离的,现在我们已经做到了。所以,我还是蛮兴奋的,现在我们的翻译品质已经到达了相当的高度。中间有些技术的细节,学术界一直在讲“跨语言检索”,研究界是属于“叶公好龙”一般的,龙没找到就在那儿做研究。我们这次真把龙给捅下来了,发现里面的问题比学术界想的多得多,以前有大量研究里没有考虑的问题,龙比我们之前想的还难,我们做了很多解决的工作。
许静芳:搜索是开放的,对翻译的要求,对适应的领域非常多,同时它非常简短,是有歧义的。曾经有一个case叫宝姿,宝姿翻译成英文是PORTS,你拿PORTS检索就发现,PORTS除了宝姿还有计算机端口,真实世界物理港口得意思,这样搜索结果就会发现多样性变化,搜索结果就不一定能直接满足用户。还有搜索结果的翻译,每条结果里都有个PORTS,哪些结果应该翻译成港口,哪些应该翻译成端口,哪些应该翻译成品牌?都是问题,所以在研发过程中有一些非常有意思的问题存在。
王小川:现在拿到英文摘要,整句翻译成中文大家知道经常翻译的是不准的,现在大家经常拿整句和缩略的句子拿过来翻译,让我们的产品来干这种活。
记者:之前有消息称搜狗将在今年IPO,请问现在搜狗投资方之间是否达成了一致的一件?上市计划进展到哪一步了?
王小川:搜狗目前有两个战略投资人,一个是搜狐,一个是腾讯。战略投资人与财务投资人不同,他们并不追求上市之后收益的最大化。对于搜狗上市问题,投资方之间已经达成了初步的共识:搜狗现在上市是阶段性的成功。但是中间还有大量的权益问题的讨论,所以现在并没有一个时间表。但是现在多方在沟通当中,这是和去年最大的不同。这是变化。
许静芳:现在产品的摘要和缩略是按字节数的,有可能单词是不完整的,只能看到一半。人结合上下文是可以理解的,如果拿之前的机器翻译系统来说一定是不认识的,我们借助最新的神经翻译技术,单词你只看到一半,它可以也具有人的特点,它能结合上下文能猜出内容,也能够翻译对。当然这个阶段以后也会带来新的问题,很有意思。
记者:跨语言翻译,翻墙之间一字之差,我们怎么区分?我们刊是国外的刊,有大量的英文,我们组织了很多翻译者在其中,每个月都会翻译那边的英文,如果用了搜狗的产品,是不是就意味着这些翻译者不用存在了,直接到美国的网站翻译过来就可以了。
许静芳:翻译并没有跨过那道墙,还是要符合中国政策法规。
王小川:举两个例子,用传统的过滤方法或监管方法,没法处理的东西,没法展现一个系统,可以举几个例子。
许静芳:墙我们是帮你翻的,如果我们做的技术还有缺陷的地方,会发现这个结果在墙外依然是打不开的,不会借助搜狗搜索就把通常不能打开的打开了。如果老有墙外的东西展现在搜索结果里,用户又打不开,这个体验非常不好。我们做的工作分两个方面,一是把墙外的结果去掉,不展现在结果了。所以,哪些结果在墙外,哪些结果在墙里,我们有很多服务器,机器可以帮你自动探测哪些页面可以打开,哪些页面不能打开,不能打开的在墙外在结果中直接给过滤掉。二是有少量能打开,但有一些敏感信息是不符合政策法规的。政府有指定的词,不一定该让中国网民搜到,但这种词符合中国规定时都基本用的英文,我们上线时做了很多细致的工作,翻译成拼音,翻译成英文。翻译成拼音时就可以有很多的技巧,比如一个人名,每一个字单独有空格,怎么写,姓和名哪个在前,有很多种写法,我们用能想到的各种情况去预防这件事情,包括搜索结果里敏感词的翻译,中文词和英文词匹配的方法,尽量把大家不应该看的东西不在搜索结果里展示。
记者:现在搜狗有知乎、微信以及海外垂直类产品,我们往往会把它当成垂直类搜索平台,但在通用搜索这块,是不是意味着我们不太做了,发搜狗力点没有在通用搜索上?而是直接通用类型的垂直类搜索。
王小川:可以理解为三点:第一,用户用垂直搜索时,这种垂直搜索是最明显产生区别的地方;第二,我们会把这种垂直的内容也融合到网页搜索里,让搜索用户更加方便,这像当年百度做音乐mp3搜索,得到用户的认可。我们是做文本信息的,不管是医疗信息、还是知乎信息,还是海外信息,能更容易和网页结合,能带动网页搜索本身品质的提升,网页搜索也会带来这种差异化;第三,我们专注在往问答迈进,今天搜索引擎的使用方式是关键词,给你10条结果。给关键词最早不是网民的第一选择,1999年,网民是愿意用句子的,比如“我长的好看吗?”这样去搜索东西,但以前发现不灵,机器听不懂。所以,网民被培养着怎么琢磨用关键词搜索,这是人适应机器的过程。就像用键盘和鼠标,没有自然的交互方式,人要学者用键盘,打拼音,打五笔。今天大家用搜索的方式也是关键词进去,是被迫的,往下的方向是让你用完整的句子来表达。
接下来不管是手机场景还是更多IOT时代未来场景里,我们会恢复到更多用自然语言与机器沟通,做完整的提问,这需要我们用技术对用户做更深层分析的,这个逻辑关系是怎样的。这是四个垂直以外在研发里重点的工作,逐步还原,让用户的语言更加自然。
Google之前提到,未来70%的query是用问答,即给answer的方式,不是给你10条链接。这样用户会变得更加方便。这是我们研发的重点,我们也投入蛮多的技术力量来做,也有很多家(公司)在做,我们应该是最认真的一家公司。今年在江苏卫视节目里有《最强大脑》和《一战到底》,《最强大脑》相对火一点,我们当时做选择。最后百度选择的是《最强大脑》,里面演示的是听觉和视觉的识别,走向识别的功能;而我们选择和《一战到底》合作,走向问答、是自然语言的处理,一年时间里有52期,一年中不断升级。我们做的是搜索里的问答系统,里面有子集,这个子集产品会放到《一战到底》里去做,会以问答形式进行。但带动我们在问答里继续往下进行,所以,垂直引擎有用,垂直引擎可以放到网页里用,同时我们自己也在升级。
记者:百度现在也在做人工智能,但他们做的人工智能和搜狗做的不太一样。搜狗是围绕搜索去做,百度更多强调
图片,让它承担更多的功能。我比较感兴趣的一点,搜狗的唯一结果什么时候能够出现?2017年,搜狗人工智能上都有哪些大的动作?
王小川:我希望,10%的搜索结果会直接给你一个搜索结果,我会给其他条目,但你只看一条就够了,这种结果在比例上是不断提升的,这是我们内部的思考。你也看到大家人工智能选择不一样。我们不叫以搜索为核心,而是以自然语言处理和自然交互为核心,交互的目的是为了回到语言里,这是我们的选择,而不是图像和语音。战略选择确实有不同。但我认为百度是没战略的公司。
记者:刚才您提到汪仔,汪仔用到了哪些前沿的技术,接下来和《一战到底》还要进行哪些内容合作。刚才提到海外搜索英文资料,现在国外旅游的人比较多,有没有用搜狗搜索和导航软件结合的设想和海外应用的设想。包括地图,有时候在海外我看地图也要看半天,这方面搜狗有没有考虑?
许静芳:关于《一站到底》的问题,大家看了节目以后,汪仔是对搜狗AI技术综合的体现,大的方面和公司本身的理念是非常一致的。两方面,一是交互,也有很多资深的媒体人把汪仔,Watson当时去参加《Jeopardy!》这样的活动去做对比。一个非常大不同是在交互上,《Jeopardy!》节目里是单独给Watson一个输入,是文字输入,当时Watson和人的输入方式就不一样。
这次我们去参加《一战到底》,机器狗汪仔靠什么?靠听靠看,和人一模一样,非常自然的交互方式,通过语音识别,图像识别,把搜到的信号转换成文字,这就是知识计算,然后做问答,交互层面上就会涉及到语言识别、图像识别,从问答变成文字以后涉及到搜索语义的理解,自然语言的理解,答案的抽取,语义的匹配,深度学习在文本上的应用,在汪仔身上都有很具体的体现。
刚刚说大的层面是符合交互和计算方面的,如果要把《一战到底》的汪仔和Watson去做对比有几个方面:
第一,语言。Watson当时用的是英文,我们是用中文实现。做语言的理解,不同的语言有不同的文法、语法在里面,代表着完全不同的技术。
第二,输入方法。当时大家看到Watson的软件形象,显示板上图像,背后是单独给他特殊的文本输入,我们通过图像识别、语音识别去做的。
第三,比赛赛制题目设置也不太一样,当时沃森对每个问题有明确的类,这个题目叫历史题、娱乐题、科技题,类似大概有6个类别。其实问题的类别在《一战到底》时也是中间非常关键的环节,但这不是《一战到底》题目中明确指定的,而是靠机器分析这个问题,文字里的语义代表的是,这个题目问的是诗人还是国家,还是某一种植物,都是靠机器自动分析出来。而Watson的设置题目本身就带着内容。
第四,抢答的时机不一样。当时Watson有个规则,题目一定是说完了才能答,虽然机器和选手之间也有谁先抢到谁答,也等问题问完了再答,看谁快。《一战到底》里有个非常大的不同,只要主持人开始念题,在任何时间点都可以去答,自己答对了可以加分,答错了对方加分。这代表高手可以预测题,只听题干一部分或一小部分就能推理出来你在问什么然后我直接给答了。这个能力非常难。刚开始我们研发时,汪仔是不具备这个能力的,我们只能问答,我们是给一个完整题目,怎么样能够答的题目越多,每一题答的尽量打得准,这是我们刚开始研发的重心,等到后面准确率和人类顶尖选手接近甚至超过他时,整个抢答赛制里机器处于劣势,之后我们花很长时间去做抢答。抢答有两方面,一是速度上,争分夺秒,我们几毫秒地去抠,中间有语义识别,搜索、知识库和检索。
整个过程中,刚开始上来就是100毫秒、500毫秒,尽量比人抢得更快,每个模块都从速度、效率上往极致走,每个模块上速度到最后提升了好几倍,但这不是最重要的环节。大家知道,人的语速是很快的,一秒钟人就念了好几个字,早5个字答,就能提前很多时间答题。所以,首先在速度上和人接近。另外,人的推理能力机器也需要有,机器也做到拿到不完整的,到目前为止所有的题目信息就是不完整的,机器首先要去预测,完整的题目要问什么,我们应该怎么答,这块花了非常多的时间,Watson完全不具备这样的能力,当时比赛的赛制就告诉你,让你答才能答。
我举个例子,但是节目组拍了顶尖选手来做测试,像徐圣明到我们这里测试。机器出现一个问题,一个题目说《鹿鼎记》中哪一种毒药?提到这个问题的时候,人已经答了,还没问完题呢。后来徐圣明说鹿鼎记就哪一种药,人会推理的。大布什、小布什的教育,大家知道要考虑是不是毕业于同一所学校?人会瞬间思能考的。机器听到大布什、小布什在琢磨问学校的事儿就有一定的难度,抢答背后有对知识更复杂的理解,不像Google Instant Search说,帮你把后面的东西补完。抢答里会变得很难。另外一方面,我们为了速度快,还做了很多的工作,比如光纤,发现赛场里是没有网络的,我们拿4G网络过去不够,所以专门拉个光纤过去,就为了省时间。
语言识别,以前语音识别,说一句话,停了0.3秒,他认为你已经说完了。现在不是,要判断什么时间他已经说完话的,把500毫秒、300毫秒变成50毫秒,这背后要做更多分析的工作。甚至当你说一半的时候要开始计算,图片、文字进行到一半就做计算,而不是像原来那样等结束说话再做。Watson对于历史题或人名,一旦限定子课题时叫封闭域,
机器人会变得很多。现在是属于开放域,虽然有大的框框,问题在这个范围里随便问的,机器的知识在里面越变越大,越难确定。这是更难的事情。Waston做对比大家会更容易理解,汪仔背后是有综合的技术挑战。
许静芳:因为我们跟顶尖选手确实切磋过好几次,拿这个测试数据来看,觉得蛮有意思的,我最近也认真地把Watson当时发表一些论文翻了一下,从测试结果来看,咱们《一站到底》的顶尖选手达到了当时Watson的水平,但是我们机器狗汪仔比Watson要更好。所以说我们会发现人过了几年的以后水平没有变化,美国的顶尖选手和中国顶尖选手具有相同的水平,不一样的地方是,机器经过几年的技术发展已经发生非常大的变化,机器在不断地提升,人相比顶尖水平就比较固定了。
王小川:大家可能都想看百度小度跟搜狗汪仔比几场,这是不可避免的事,这个场景也是挺好的。
记者:去年花了1.8亿投资了天工智能计算研究院,今年咱们还不会持续这么大的能力去投?
王小川:1.8亿是一次性的投入,但实验室会有一些额外的费用产生,会小一些,不会这么显著,但足够使得我们联合研究有这样的成绩。
记者:和智能硬件的结合能说一下吗?
王小川:智能硬件有三种场景,一种场景是客厅场景或家庭场景,一种是车载场景,一种是移动场景,这三个场景里我们都有切入的方式,有的是自研,有的靠合作、合资,有的是提供API,让别人来调用。这三种情况都会发生。
记者:有更详细的东西可以透露吗?比如客厅具体和什么合作?因为大家提到智能硬件就是这三大场景。
王小川:客厅场景方面我们在投资里面已经推动了,跟国内资源互补、优势互补的公司正在往前走。自研像我们之前有糖猫,比较早,我们有供应链,有大量的销售点,内部的管理团队也建起来了,不过它不是我心目中典型的智能硬件。我对智能硬件是希望它能做判断,能够像人做自然的交互和后面的知识计算,它的连接工具和糖猫本身是给没手机的孩子用的,它相当于一个试探的过程。今年我们会投入到智能硬件的自研。刚才我们讲了三件事,问答、对话、翻译,是从这几个场景切入的。
记者:这次咱们财报使用人民币单位,以前都是美元,什么原因?
王小川:两个原因,一是美元升值,人民币贬值了,这时候再用美元计价大家容易产生误导,因为之前美元和人民币还是相对比较稳定的,最近这几年有大的变动,我们用人民币更能反映我们的竞争力和变化。
记者:我对比了去年的数据,去年我们收入和盈利增长差不多50%多,是因为搜狗今年做了很大的投入吗?
王小川:两个原因,一个是投入很大,另外,大家知道搜索从推广改成广告了,就是国家把搜索的收入性质定义改了,改了之后,这个就严格了很多,还有税收等,所以有一定的政策上的影响。
记者:我们今年的投入、投资,包括在AI方面,包括明医方面的投入会相对减少吗?对下一个季度财报的预计会怎么样?
王小川:我们预计比2016年多。
记者:这个问题还是想问您一个规划,就是咱们之前的增长速度非常快,但是不可能永远都是这么一个高速,因为在AI方面的投资会越来越大,不知道你有没有什么计划和节奏?
王小川:我们收入本身的规模可以说明问题,利润不是关键的事儿,只要能做长远投资,而不是计划出来的,这只能当成中间的一个结果。
记者:去年和今年有一个特别大的不同,就是去年,您最开始做财报讲解时,提到了很多新的概念和思路,但是今年我感觉把那些思路逐步地变现,一步步地落地,把一些功能再升级的过程,今年有没有特别大的爆炸性的、突破性的想法?
王小川:我们开始在努力提硬件这个词,还想多爆炸呢?
记者:问一下AI这个事,我记得大概是您说2015年AI其实没有什么突破,到了2016年,AI是有一点遇挫,您到海外跟AlphaGo团队做交流,聊第四盘棋是怎么回事,聊深度学习,深度学习遇到什么瓶颈?您怎么看待AI这件事?其实咱们跟大的AI趋势有一些不一样,大的方向是说AI有一点遇挫,但是今年搜狗在AI方面对外宣讲、产品研发和推广都会更高调一些。
王小川:最开始在AI方面谈AlphaGo的时候大家都是比较悲观的,不管是传统媒体人还是IT界的人都说AlphaGo不行时,我说AlphaGo能行,还写在知乎上。后来AlphaGo赢了,大家就开始过于高调了,觉得这个机器可能马上把人都干掉了,讲了深度学习要统治世界等等,当时我们内部还在不断往前走,但是对外我们会负责任地去发声,我说深度学习就有一个瓶颈的,不要把它想的什么都能干,即便做无人驾驶都没到那么靠谱的阶段,而且机器现在对语言的处理能力很弱。
那时候行业投资很疯狂,大家会幻想,投资人会有一种情结,看不懂的东西就觉得特别美。创业者本来就很疯狂,在投资方的推动下,最后想出的事儿可能和现实就有差距。比如做图像的一些公司,很多公司都在亏损,最后都卖掉。在这里面,大家对技术的可行性和商业模式没有深度思考。深度学习有很多瓶颈,即便能做事情也要分(着看),如果只做识别、合成、生成,可能商业价值是小的。机器用来做判断,making decision这个事情才有很大的意义。在商业价值里面我们可以想,这个事(做判断)才是有意义的,确实有些“坑”大家都进去,但最后技术做不到或技术做到了但没有商业上的应用场景或商业上的收入。
现在为止,我发现行业中一部分的东西过于低迷,觉得这个东西不行或者(泡沫破灭)。但是我们知道,当机器开始能做判断的时候,本身能够产生商业智慧,它有服务上的价值和变现能力的,而做合成、生成和识别,是能改进交互的,而改进交互最受益的公司就是搜索类公司。所以,搜索类公司在AI行业里是受益的,而且就用它提高自然交互和知识计算,那相对是稳健的。
记者:所以你会敲敲代码来感受一下吗?
王小川:我会试一下,至少我会知道,包括并行度上机器多了并行到底能不能实现,新的算法里面怎么用,这些都是能和团队进行讨论的。我们是真正知道,已经不恐惧,不会从恐惧转化为幻想,我们没有这种幻想。所以,我们可以平稳地往前走。我们公司基因里,是一步一步开始去做的。搜狗目前盈利了,到了一个规模盈利的状态。所以,其实我们有一种天生的东西,叫避免不靠谱的事情发生,如果技术上走错路是非常可笑的一件事。
记者:就是技术上走通的可能性还是有的?
王小川:你会觉得有这种可能性,但是我们会小,有的公司就会大,对战略不了解的公司。
记者:去年,我问您对搜索整个未来的格局是怎么看的,当时您大概提了两个关键词:问答和服务。今年过去一整年了,而且今年咱们很多东西落地了,您认为对未来的格局有没有更细化或有一些差异、变化的地方。或者未来在那些关键的时间点是不是能看得更清楚一点。
王小川:问答是一个渐变的过程,所以我们今年说10%的搜索能够走问答,它不能做到在短期里面突然就把这个事情颠覆了,我们只能说是慢慢地成长。它的好处在于,它可以使得你公司本身有一块收入或者利润支持你良性发展,让你有机会,有更多的时间向未来布局,这是我们现在一个好的状态。
但如果假设搜索引擎做到顶了,收入往下掉,你可能着急要赶紧找个大数来填它,这种压力在战略上可能会带来很大的困难。现在搜狗在AI技术能力里面,在综合的掌握里也是最TOP的公司之一。在产品上,我们有自己产品的积累,包括硬件上,我们比其它公司更有能力去在未来布局,或者在路线里面走稳,因为AI不是一个创业公司、小公司就能玩得动的东西。需要数据和大量研发投入。搜索再往前走,但我们公司已经开始对未来进行投资。
记者:搜索这块咱们排名很清晰的,在AI这块我们给自己怎么排名的?
王小川:搜索排名第二,这很清楚。AI方面,如果非要让我数,我觉得我们应该在前三的位置。
记者:您觉得现在汪仔,您所说的NLU自然语言的理解,你觉得它达到你想象的程度了吗?汪仔在整个搜索里的角色是什么?它只是展示品还是最后成为产品?就是汪仔过了《一站到底》之后,它的走向会是什么?
许静芳:我认为,通用NLU没有达到,或者现在也没有系统能够达到。如果我们聚焦在《一站到底》这样的特定设计下,它是足够好,不管是它回答的准确度,还是它回答的问题,它回答的时间点已经足够靠前,在这样的设计下面谈已经不错了。
《一站到底》在公司是个什么样的地位?其实我们是先做问答然后才有《一站到底》,《一站到底》其实是问答里非常特殊甚至相对偏简单的类别,它就问的是实体,所有的答案都是实体的一种。但是回到搜索每天面对的问答,有问实体的,也有问经验型的,比如“我怎么烧红烧肉”,也有原因这种“天空为什么是蓝的?”也有“范冰冰漂亮还是李冰冰漂亮”这种比较型的,或者“孕妇能不能吃螃蟹”,其实问答有很多种类别,实体是其中一种相对比较特殊的类别,在实体类别里我们把关于实体型问答应用到《一站到底》这个特殊环境里。当然,为了参加比赛取得成绩,打败人,那又对《一站到底》做了很多特殊的优化。所以,问答是我们未来发展的方向,《一站到底》是我们展示和挑战自己的一个平台。
记者:你觉得汪仔好看吗?
王小川:汪仔代表的是一个形象,不管是虚拟的形象,还是对问答对技术形象的展示,这就是在整个大局里面的一种位置。往下它也会更加聪明,能力也会有人用,不限于这个事情,这是好的积累,但是能不能把它变成智能硬件类的玩具是需要论证的。
记者:今天听您提到硬件这个词频率还蛮高的。我记得三年前智能手机非常好的时候已经有人提出,智能硬件未来是取代iPhone的趋势,从最近一两年来,有越来越多唱衰它的声音,所以想问下您,为什么会在现在来提这个词。
王小川:好像其他几年我一直唱衰硬件,那时候硬件特别火,因为确实死了一堆公司。硬件为核心的时候是资本驱动的,是用到一个概念里去,为了硬件而硬件。如果做个体重秤踩一脚就能够轻一两肉,卖8000元也有人买。回到智能硬件的意义里面去,比如做智能插座我觉得不是个关键的问题,是资本推动的。现在智能硬件核心的东西,是把自然交互和做判断的能力放进去,机器在里面能做交互和判断。微软的手表一直卖得不太好,因为它屏幕小,里面AI不够聪明没有办法取代手机。比如天气预报,手机上可以显示出今天明天后天、刮风、下雨、PM2.5指数。手表上信息量是不够的,如果它不够聪明,不知道你要什么。当然现在没法排这么多,因为不实用。如果AI足够好了,“你问他明天要不要洗车吗?”它会给你一个答复,这个时候智能硬件足够聪明,交互足够简单,就能跑起来了,智能硬件要看交互能力和判断能力是否够强,以这个少屏幕甚至没有屏幕的方式就能够做这样的承载,否则就没有这个智能硬件的意义。一个新硬件做成必须让比手机更便捷,让它在数据处理能力上更强才行。以前智能硬件数据处理能力也没更强,也没法更便携,那就是为硬件而硬件的事情。
记者:刚才您说在智能硬件上会找合作伙伴,这个事情也在推进当中。您要找合作伙伴的话,标准是什么?
王小川:在硬件领域里,第一,是很有灵性的市场敏感度,把智能硬件做好,我开放能力给你,开放API给你,你在里面跑硬件,以合作伙伴为主。第二,对方有平台级的能力,有大规模开模、建模、设计能力、供应链管理能力,它也有战略的意义在,我们可以用一种合资的模式去进行,当然也会对它开放能力。第三,就是偏向于我们自己的能力,比如翻译,也有可能自己就干了。
记者:您提到国家广告法的调整,对搜狗有一定的影响。过去来看,这个影响的幅度或规模大概在什么样的区间?
王小川:举个例子,广告法就是收入里面减3%的税,利润里就更多了,比如有的是20%,那就是减掉3/20,就可能15%的利润就没了,在利润中会放大的。还有广告知识的监管和行业的限制,有的行业就不让你投广告了,我不是指医疗,其他行业都开始限制。
记者:您刚才说糖猫,2015年、2016年还是挺火的,后来觉得它不是你理想中的智能硬件,去年的声音很小。但我看360推它的儿童手表还是挺火的。
王小川:糖猫从战略意义上来说对我们是入门,我们通过智能硬件建立了分销渠道和供应链管理。更多为了我们跟这些设备公司对话的时候不外行,我们达到了这样的目的,之后我们往下AI多走一走,这股力量就会跟上。糖猫我们会做好,这是我们硬件战略中间的一部分。糖猫做的好不好,和搜狗并没有直接的干系。
记者:百度也在做自动驾驶的东西,车载毕竟是比较好的场景,您有什么样的考虑?
王小川:无人驾驶有两个事,一个是无人驾驶里的辅助系统、导航系统,这个事情是有意义的;但开车目前还无法完全实现。
记者:我们在车载这块合作是不是B端的合作,与汽车厂商进行合作?
王小川:会在里面做一些东西,但不是无人驾驶这个事情,开车这事儿不是搜索公司该干的。
记者:聚焦在语言导航是吗?
王小川:对,自然交互和实时计算,导航在这个范围里。
记者:搜索引擎,我看您对它核心竞争力的描述,一是自然语言的交互,二是知识计算,因为前两年我看到搜狗投资了知乎。今天听您说会在医疗和海外方面,其实这都是一个知识的体系。为什么不是信息,而是做知识方面的东西。
王小川:语言是一种载体,像我们搜图片的时候,只关注图片周边的文字其实没有理解图片本身。这种载体要往人工智能做更深是需要对信息的内容有更多的理解,如果文字或叫Language这个词比较浅层,要挖Language背后的东西叫knowledge,背后的信息在这儿,叫知识。
记者:今年跟知乎有没有比较大的合作?
王小川:知乎在搜狗投资之后,搜索已经涨了6倍,流量也涨了很多,在我们看来,这个合作是在稳健的模式里,知乎成长得特别快。
记者:今年跟他们高管团队有没有做一些比较大的沟通?
王小川:喝酒算吗?
记者:还是谈正经业务的事吧。
王小川:我们增加了投资额,提升在知乎的投资额。
记者:小度在《最强大脑》上所完成的项目汪仔也能完成吗?这两个产品在您看来,它体现的两个公司,比如在人工智能的技术和产品路线上有什么不同?现在做汪仔,是不是意味着搜狗下一步在人工智能继续在商用上做的是家用机器人或者教学类机器人?
王小川:我没有表达要做家用机器人或者教育机器人,只是说我们要做智能硬件。从能力上讲,双方的不同点,我们强调的是语言,即便我们有图像和声音,但是更多回到语言上,而小度的研发是图像识别方面。
记者:语音这块百度也在做。
王小川:语音大家都做,但是语音的品质我们是最好的,语料规模我们也是最大的。
记者:其实去年注意到咱们有很多的场景,尤其输入法,O2O也在里面,这里面会不会衍生出一些新的商业模式,您的摸索上有没有一些经验和试错?各个AI平台都在努力争取跟厂商合作,包括讯飞主要是偏B端的。你们会着力于哪些点去吸引它?现在各家都会在垂直领域突破,讯飞是教育,我们侧重于医疗,所以在这个垂直领域上,你们以什么路径实现?去年AI开始在中国大热,Kaiyun官方网站app登录 薪水也不断提高,有的Kaiyun官方网站app登录 成本占50%都有,您怎么看这个问题?搜狗在Kaiyun官方网站app登录 积累上有什么样的做法?
王小川:第一个问题,输入法一直在试探的地方是从工具到服务,已经有一些变化在做了,像输入法有花键,点了触碰,帮你找图片,帮你做翻译,帮你做音乐的分享,从联想的分享里我们做尝试,我们大的逻辑是从工具变成帮用户做选择的事情,没有变过,产品上也在做升级,对于新产品是可以期待的。
记者:盈利模式上会有一些推进吗?
王小川:现在我们主要产品上能够接受,只要能够被接受,能够帮用户做选择,就能够有商业模式,用户端上用户也会感兴趣。
关于AI厂商的优势,比如我们做导航,不仅有语音识别、语音合成,还有自然交互对话系统,背后其实有更多的知识,比如搜狗有地图,在产品里如果不把地图的能力穿透,最后你分成两个公司做的效果不好。我们有服务的能力,比如去机场,问你航班号,你知道飞机什么时候起飞,可以把这种能力带到对话或用户交互里,知乎做语音、自然语言,做不到这个事情的,这就是服务能力跟着一块就出去了。是这样的区别,搜狗2C里面积累了大量对用户服务能力。
垂直领域里面,做医疗,我本身没有把它当成是新的业务来看,我认为,它是搜索下的一个延展,讯飞做教育是行业开拓,和我们的性质不太一样,不是想不断到不同的行业里去,我们还是想在信息获取、信息表达、自然语言交互里做,这方面我们更聚焦的。但我们可以输出能力,教育机构要用这个能力的我们会输送给别人去干,我们并不求在这里面占据多大的市场份额或规模性的收入利润。
关于AIKaiyun官方网站app登录 ,需要我们更多的投入,搜狗今天的状态,这个公司大概也有两千多人,算上兼职学生加起来也有小三千人,当然这里面我们自己培养的人会非常多。我们去招人,招10个人进来,就是10/3000,和创业公司相比起来已经没有不是什么大的压力。