Deepmind之前开发的玩雅达利(Atari)街机游戏的人工智能是全新一代的智能技术——大数据驱动通用人工智能(Big Data-driven Artificial General Intelligence)。
就像这个名字所提到的,这里有两个重要的因素,一是“大数据”驱动,二是通用人工智能。大数据驱动的机器学习使得机器尽量脱离人类的经验指导,自动在海量数据和工作环境中挖掘知识取得进步。而通用人工智能基于端对端(end-to-end)的深度强化学习(Deep Reinforcement Learning),帮助机器能在不同的任务中共享一套学习框架,无需人类进一步调试。
这两个因素同时作用出一个效果,即人需要的干预越来越少,而机器在与环境交互反馈中的自主学习比重越来越大。
“大数据”驱动的机器学习
AlphaGo的围棋棋力来自于30万张人类对弈棋谱以及3千万次自我对弈,这是一个典型的大数据机器学习产物。
相比之下,1996年击败国际象棋大师卡斯帕罗夫的IBM深蓝(Deep Blue)人工智能,其依赖的是大量人类总结出来的走子规则的手动输入,以及基于超级计算机每秒上亿次搜索的全宽度(full-width)搜索解决方案。
简单地说,深蓝的人工智能相当于人类把自己下象棋的知识和经验手动输入电脑中,而AlphaGo的人工智能是人类把一堆棋谱“丢”给电脑,后者自己学习总结出来甚至进一步超出人类围棋认知范畴的知识。
基于机器学习来搭建人工智能,人类不需要通过显示地编程来教机器如何工作,而是给出一个学习框架,告诉机器如何根据自身当前设置以及提取环境的反馈去进一步更新参数,进而达到一个更好的工作表现。
然后人类只需要把大量数据“喂”进机器,机器就可以不断学习不断优化自身的参数了。这样,人类就不需要自己首先去总结经验再交给机器,而是变成了“甩手掌柜”,在一边看着机器学习起来就行。
随着机器学习的模型先进性以及机器处理大数据的能力不断升级,基于大数据的人工智能已经在人们的生活当中扮演越来越重要的角色。
过去10年间,基于大数据的人工智能已经在各个领域展露头角,包括在线广告的精准投放、搜索引擎个性化网页排序、电商的个性化商品推荐、社交网络的好友建议、人脸识别、图像识别、自然语言理解、机器翻译、语音识别、无人机跟踪技术、汽车自动驾驶等等。
很明显,未来的10年内,越来越多的
应用场景会装配上人工智能,而且机器会不断学习,做得越来越好。
通用人工智能
Deepmind和其它做机器学习的科技公司的不同在于它提出来的通用人工智能(Artificial General Intelligence)的概念和产品。通用人工智能背后的技术是深度强化学习,其主要有两个特点,一是端对端(end-to-end)的学习,二是自适应, 无需人类调参而胜任不同的任务。
Deepmind之前推出的玩街机游戏的通用人工智能技术就完美地诠释了这两个特点。
首先,机器的输入直接是游戏屏幕的像素,不需要任何特征设计和编码。这里要归功于最近4年来名声大噪的深度学习技术。深度学习通过建立较深层数的人工神经网络模型,使机器能够自动从原始输入信息中提取、学习出适用于预测、决策的高层特征。
例如在人脸识别这一场景中,深度卷积网络(deep convolutional networks)输入层得到
图片像素本身,底层网络学习出点、直线、曲线、拐角等初级特征,中层网络在这些点、线、角的基础上学习出眼睛、鼻子、嘴等器官特征,高层网络则进一步组合这些器官特征判断出图片是否包含人脸。
其次,同样设置的机器可以做不同的任务,只要“喂”进去的数据不同,无需人类调参或者只需要极小的人类工作花销。Deepmind使用同一个深度Q学习网络(DQN,deep-q-network)模型可以玩不同的街机游戏,只需要让机器玩某个游戏几天,它就能学会并超过人类玩家。
通用人工智能可以理解为是在强化学习的框架下,结合其在不同任务下的适应性、模型零耦合(model-free)的优势和深度学习的特征自动提取的优势,实现出的能胜任多种任务端对端学习的超级人工智能。这已经十分接近人类学习和工作的方式了。
正是由于以上两点优势,人类在开发新一代人工智能的过程中需要做的干涉越来越少,交给机器去自动完善的学习比重越来越大,这为人工智能的工作水平的提升以及在各个领域的普及带来了本质的飞跃。
万物互联的人工智能时代
最近这三年,我们总是被各种耀眼的技术词汇轰炸着:大数据、机器学习、人工智能、物联网、
工业4.0、互联网+…… 我认为,这些五花八门的词汇其实都在指向同一个未来:一个万物互联的人工智能时代。
我希望从三个维度上的趋势来解释这个观点:互联化、数据化和智能化。
互联化是指我们真实世界的设备与设备互联,而不只是一台服务器上的网站和另一台服务器的网站相连。以汽车举例,我们的汽车可以连接到家里的空调,这样我们在回家的路上就可以发出指令启动房间里的空调;汽车也可以和路边的建筑设施互联,找到适合的停车位或者商场中的服务。
汽车之间也可以互联,通讯汽车间距、速度等信息,自动保障行车安全。这就是物联网(在汽车垂直领域称作车联网),其在制造业的应用被德国称为工业4.0,在生活上的应用则被我们中国称为互联网+。
数据化是指尽可能多的设备信息、工作状态被量化成数据并可在设备之间通讯。同样举汽车的例子,司机每天开车的路径、其中各个地点的速度、加速度、油门深浅、刹车轻重、路况等信息都可以通过传感器产生可记录、通讯和分析的数据。
目前,以特斯拉为代表的新能源汽车已经在数据化进程上走得很远了。其他领域,例如家居、健康,也在推进数据化进程。由于越来越多的设备互联,各个设备的状态也进一步数据化,人类在接下来的10年内产生的数据量将会比互联网时代更上一个新台阶。
从大数据的角度来讲,“大”不但指数据规模大,更指的是数据维度高。而设备的互联化和数据化将会产生比当今互联网大数据更加名副其实的大数据。
智能化则是在设备互联化、数据化的基础上通过数据驱动的人工智能解决各种各样的快速有效的预测和决策问题。从机器学习的角度来讲,用于训练的数据规模越大、维度越高,就越能学习出更复杂的高级模型,胜任更高难度的智能工作。
大数据是原材料,机器学习是原材料加工厂,而新一代人工智能服务则是工厂出炉的产品被消费在越来越多的日常生活中。我们看到最近这三年这样一个新型产业链的每个环节都在蓬勃发展,而在AlphaGo战胜李世石的今天,更多的人开始注意到这条产业链带来的人工智能产品将会在未来10年间给人们的生活带来翻天覆地的改善。
学术界与产业界双赢
结合真实大数据并在人们日常生活中发挥作用的人工智能研究是目前最有效率并最符合整个产业链发展趋势的研究方式。研究大数据驱动的人工智能,首先得有“活的”大数据可供研究,才在真实环境中不断尝试研发新的人工智能模型。
这样一个交互式的研究环境最能够促进新成果的诞生。这也是当今许多世界级并且奋战在人工智能研究一线的大学教授会选择在一家科技企业兼职的原因。
而几年前高校的数据挖掘和机器学习研究仍然倾向于靠着一个许多年前生成的数据集不断地测试新模型。从实践经验来看,这样工作在一个老的小数据集上的模型很难胜任现实生活中的大规模动态数据。而高校实验室需要作出最前沿的人工智能技术就需要奋斗在大数据处理的第一线。“Get hands dirty。”这样才能切身感受到最真实最野性的数据,才能真正理解数据和基于数据搭建起来的人工智能。
我认为在大数据驱动的人工智能研究中,大学科研团队与工业界算法团队相比,其优势在于能将主要精力投入在算法研究中,能在拥有大数据和测试平台的基础上,产出一般企业想不到的有效算法;另外大学研究者由于长期保持相关文献的收集整理,对领域内的最新技术以及新旧技术的全局理解有很深的体会。
大数据驱动的人工智能是一个产业界和学术界双赢合作的领域。
我在伦敦大学学院的博士课题是互联网精准展示广告算法。互联网广告领域的数据由于涉及广告拍卖交易中的价格信息而十分敏感,所以该领域在2012年之前并不存在任何互联网广告领域的公开数据集可供高校研究者做研究。该领域绝大多数研究论文皆来自涉足互联网广告的科技公司,例如谷歌、微软、雅虎等等。
对于高校研究者来说,做互联网广告大数据的研究,首要任务就是同相关企业建立研究合作,获取最新的广告投放数据,并在合作企业的商业平台上直接做面向真实用户流量的实验。我们研究组在伦敦、北京和硅谷寻找到了多家广告科技企业进行合作,其中既有业务量和数据庞大的IT巨人,也有迭代速度极快的初创公司。
我在博士期间发表的数篇互联网广告技术方面的论文,都包含了在这些企业平台上做的在线实验。我也在和企业的交互中学习到了很多在高校实验室无法接触到的实践经验。根据我们的研究产出,合作的企业也都有效提升了广告投放的效益。