前段时间“Viva Technology Paris 2016”科技峰会在法国巴黎举办,李彦宏受邀出席,谈到全球互联网发展趋势时,他表示,人工智能将成为真正为人们的生活、生命带来保障、甚至造福整个社会的革命性科技。
目前,百度多数服务已经基于人工智能,未来也考虑进军欧美。李彦宏的人工智能论和国际化布局,看似毫不相关,但却暗藏玄机。因为一旦人工智能技术进入到常态引用阶段,它将打破无数的边界——不仅仅是行业,而且还有国家。这种彻底而全面的推动力势必会引导全世界产生像蒸汽机、电、互联网和移动互联网一样的巨大变革。
人工智能:AlphaGo是一次好的起步
2016年科技界最具娱乐性的新闻莫过于AlphaGo击败李世石。当AlphaGo战胜李世石的消息传遍世界,人们对人工智能发出了惊叹与关注,甚至开始讨论机器控制人类的威胁。其实,深入洞察人工智能的历史与发展,就会发现真相既不是人们想象中的那么好,也不是那么糟糕。
1956年夏季,以麦卡赛、明斯基、罗切斯特和申农等为首的一批有远见卓识的年轻科学家在一起聚会,共同研究和探讨用机器模拟智能的一系列有关问题,并首次提出了“人工智能”这一术语,标志着“人工智能”这门新兴学科的正式诞生。二十世纪七十年代以来被称为世界三大尖端技术之一( 空间技术、 能源技术、 人工智能)。也被认为是二十一世纪三大尖端技术(基因工程、 纳米科学、 人工智能)之一。
事实上,从哲学角度看,研究人工智能的人分成了两大阵营,弱人工智能与强人工智能。弱人工智能观点认为不可能制造出能真正地推理(Reasoning)和解决问题(Problem_solving)的智能机器,这些机器只不过看起来像是智能的。强人工智能观点认为有可能制造出真正能推理(Reasoning)和解决问题(Problem_solving)的智能机器,甚至可能有知觉和自我意识。
以大名鼎鼎的AlphaGo来看,它其实依然站在了弱人工智能的阵营。因为它的原理只不过是根据记忆与胜算概率,快速匹配出“人类历史的结果”,依然只是人类棋类高手的集合。对于整个人工智能行业来说,AlphaGo是一次将小众创新让普罗大众熟知的很好尝试。但无论是Google还是百度,人工智能的终极目的都不只是“基于人类经验”,而是“有意识的自我演进”。就如同百度无人汽车、自动驾驶、金融大数据等未来感十足的布局,正是利用互联网的前瞻能力、充分的技术领先优势和远超传统企业的资金、人力、知识禀赋优势,抢占未来科技革命的最高点。
强人工智能孕育的商机:应用主义的胜利
为什么百度在人工智能领域的布局看似和Google截然不同?这或许与中国文化有关。中国历来注重实用主义,不管是传统儒家的“知行合一”,还是佛法的“佛法在世间,不离世间觉”,都非常注重概念与实相的结合。我们不妨比较一下Google与百度在语音识别、用户画像、无人车等方面的进展。
在语音识别方面,Google实际上是在2011年就测试推出语音识别服务的,但直到苹果在2012年发布Siri后,才加快了扩张的步伐。尽管如此,Google语音引擎API直到2016年才对外开放,通过Cloud Speech API提供给第三方,并且声明初期免费,未来可能收费,而且还需要单独审核。但在这几年中,我们可以明显感觉,Google因为中国市场的政策问题摇摆不定,而错失了很多良机。
作为中国最大的搜索引擎,百度累积了最大规模的的中文语音数据,然后将这些数据注入其最新的语音识别引擎Deep Speech 2。这款识别引擎通过自主的深度学习算法,能独立的学习怎样将中文普通话合乎逻辑的翻译成英文。当Deep Speech 2在2015年第一次面世时,百度首席科学家Andrew Ng表示Deep Speech 2在试运行中以10%文字错误率的优异表现超过了Google的语音识别API。而在今年2月,Deep Speech 2最近公开的短语类语音错误率在3.7%左右,而Google在约一年前公开的数据中显示其语音引擎错误率为8%,一年前为15%左右。这意味着,百度Deep Speech 2在语音识别能力上不但领先于Google,而且超过正常人听力水平。
而更令人吃惊的是,Deep Speech 2实际上最初并不是为了理解中文而被设计出来的。百度美国的人工智能实验室主管Dr. Adam Coates解释到:“我们用英语开发出这套系统,但由于它完全是自主深度学习机制,它只需要海量的数据,所以我们只需把数据替换成中文,然后它就慢慢被训练成一个强大的中文语音引擎。”百度Deep Speech 2甚至还接受“混合语音”,即中英混杂。这也意味着,只要有足够多的语料库,百度Deep Speech 2极有可能在英语国度一鸣惊人。当然,从李彦宏的动作来看,百度还是在深耕中国市场——从百度在中国承诺语音基础服务永久免费那一刻开始,高技术+低成本双擎驱动,已经确保百度这家巨头在中国市场的优势地位十拿九稳
在用户画像技术上,相比Google而言,百度的用户画像技术更为深入。不仅以服务流、信息流直接对接用户需求,更通过大数据,能够直接为符合条件、但又被金融机构看不上的教育用户提供小微贷款秒批服务。与其他教育贷款平台相比,百度拥有海量用户数据,可形成用户画像,进而为征信提供参考,同时,百度拥有深度学习等核心技术,与风控模型结合,形成智能风控体系。这是百度教育贷款能实现“秒批”的原因所在。可以说,正是百度更加注重实用性,也使得人工智能能够惠及更多行业。
在无人车领域,尽管已经探索很多年,但Google依然没有将之产品化的时间表,更别说商品化了。2015年12月,百度的无人驾驶车在国内首次实现城市、环路及高速道路混合路况下的全自动驾驶。2015年,百度提出无人车三年商用,五年量产的计划。如果成功,将在应用速度上超越Google。
与Google相比,百度更加注重强人工智能的研发和应用。或许,在普世性上,百度的选择更加具有深远影响。因为强人工智能的自适应性非常强,一旦研发成功,将不是线性的增长,而是指数级的爆发。随着百度大脑等项目的不断升级开源,它影响的可能并非一两个行业,而是整体。
几千年前,中国老祖宗在《黄帝内经》灵枢·本神中说了一段高深莫测的话,“所以任物者谓之心;心有所忆谓之意;意之所存谓之志;因志而存变谓之思;因思而远慕谓之虑;因虑而处物谓之智。”这段话实际上就揭示了人工智能的本质所在。心就是计算力,意就是记忆,就是片段,志就是大数据,而同一个片段的不同可能的连接,就是思。对不同可能的场景进行计算,得到最优的路径就是虑,根据不同的路径解决不同的实际问题,才是真正的智慧。
或许,技术的发展,在初期可能是逻辑上的建模与哲学思辨,但在后期,它一定需要通过事实的检验才会大放光芒。在中国这个网民最多、移动互联网应用最为发达、语言也最为复杂(请想象一下够意思、意思意思、没意思这样的近似描述)的国度,已经迎来了独立发展的最佳时机。中国的人工智能,或将在应用中不断演进,引领世界的未来。