李飞飞从洗衣工到斯坦福教授的传奇经历被传遍全国,不得不让人感叹,我们又回到了崇拜科学家的时代。
或许是因为人工智能本身就是一个学术话语权极强的领域,现在的AI企业不管体量大小,总要请来几个教授、专家坐镇,时不时还要发篇论文,刷刷CVPR等等竞赛的排名。
可问题的关键是,我们崇拜科学家,不仅仅是因为科学家有非凡的学术能力,还因为他们是把人工智能技术从论文中带到我们身边的传火者。
科学家常有,而传火者不常有。今天就来谈谈,怎样才能称得上人工智能领域的传火者。
论文产品化:象牙塔内外的海水与火焰
在很多人的概念里都存有一个误区,论文发的多、专利申请的多、竞赛排名足够高就意味着技术有着更高的实用性和商业前景。可实际上从论文到产品,再到优秀的产品,之间里程往往比我们想象中要遥远。
不管是论文还是赛事,往往都会给出一个理想的恒定实验环境来追求某一项技术的极致可能。比如给出统一的硬件标准或数据库,而得出的结果也是在某一标准下的最佳结果。
这就导致一种尴尬的结果:很多时候论文走向一种非常刁钻的方向,很难实际
应用在生活中。像是耗费大量计算资源去追求极小的模型压缩,或是牺牲计算速度去在极小范围内提升模型准确率。但这些研究成果往往只能在仿真环境中起作用,要想应用到现实中来,往往会遇到这样那样的问题。
现在很多技术模型都是开源共享的,将公开的模型进行参数调试,从一个领域移植到另一领域并不难,可想要实现产品化,就要为模型寻找到合适场景,嵌入到适用的软件或硬件中。在这一过程中,如何面对技术开源,难以建立壁垒的问题就是一个难点。应用成本越来越低的人脸识别,就是技术无壁垒、产品想象力匮乏形成的结果。
即使把技术成功产品化,也要考量产品的实际应用性。人工智能技术的加入是不是真的能提升用户体验,体验的提升和所耗费的成本之间是否又能找到平衡点……很多时候人工智能产品还未经市场检验,就已经在折戟在论文产品化的过程中了。
论文和排名仅仅是人工智能产业的一小部分,有一些企业靠这些可以拿到大笔融资,但这绝不仅仅是成功的标志。专家教授一脸意气风发,可背后的投资人还双目灼灼的盼着论文变现呢。到最后往往在学界和业界成了两个极端,一边歌舞升平的写着论文开着会,另一边则为了优化产品急成了热锅上的蚂蚁。
总之,论文和会议竞赛中的技术存在于仿真世界中,代表的是人工智能无限的可能性。而如今科学家们纷纷走出象牙塔,我们希望看到的是他们把技术从仿真世界带到物理世界,向我们展示人工智能的应用性。
把目光投向物理世界,学术力量落足在哪?
在今天的人工智能热潮中,既然有人靠水论文拿融资,自然也会有人可以成为技术的传火者,把学术能力化为产品能力甚至商业能力。下面就分别介绍一下自然语言处理、计算机视觉和强化学习三个领域中的传火者。
帮谷歌AI连接中国的李飞飞
抛开谷歌的光环,从加州理工毕业的李飞飞自身也有着极高的学术起点,在斯坦福实验室中的身体力行培养出了不少牛人,也凭着TED上强大的演讲能力吸引了不少人关注计算机视觉领域。
李飞飞对人工智能产业最大的贡献无疑是创立了世界上最大的
图片识别数据库ImageNet。此前机器学习一直饱受过拟合和泛化的困扰,学界一直试图在模型上寻找解决方式,直到李飞飞开始主导ImageNet的研究,从数据集入手试图改变游戏规则。
ImageNet的影响力越来越大,甚至从中诞生了卷积神经网络这样实用性极高的技术,计算机视觉和深度学习也越来越多的应用在物理世界中:社交网络的图像标注、自动驾驶的物体监测……大量的落地应用也再不断的向CV技术提供反馈,物理世界的技术应用也催化了仿真世界中技术的发展。
教机器人叠毛巾的Pieter Abbeel
提到强化学习,大多数人会认为这是一项距离现实非常遥远的技术,不过一直有人在尝试着把这一技术带到现实,Pieter
abbeel就是其中之一。
在博士时期,Pieter Abbeel就与吴恩达一同提出了师徒学习这一强化学习中的重要概念。在伯克利任教期间,还因让
机器人通过强化学习学会叠毛巾获得了MIT颁发的TR35奖项。后来入职马斯克的OpenAI,还推出了著名的机器人训练场Gym,让很多团队可以在低成本的前提下快速训练智能体。
直到今天,硅谷机器人制造商Willow Garage的很多产品中还有Pieter Abbeel利用强化学习训练的成果。如今Pieter Abbeel已经离开OpenAI,创立自己的团队,专注于利用强化学习让现有硬件设备自主学习完成任务。
自动化的普及度不断增高的过程,本质上也是机器人训练成本不断降低的过程,强化学习的应用的落足之处也在其中。
为百度布局深度学习的王海峰
NLP和CV两个领域,都聚集了大量华人科学家。在学界和产业界都有布局的,不光有李飞飞,王海峰也是其中一个典型。
王海峰在学界的成就很多,比如在16年当选了国际计算语言学会(The Association for Computational Linguistics)的会士。在这个于影响力、权威性和活跃度兼备的学术组织中,王海峰成了是大陆首位、也是最年轻的一位ACL院士。
2010年入职百度后,王海峰也在百度获得了很大的发挥空间,接连布局了自然语言处理、互联网数据研发、图片搜索和语音技术等等多个部门。在2013年协助创立百度深度学习研究院后,很快我们就看到了百度翻译、语音搜索等等产品上的变化。
在这些用户体验的感受差异中,体现的是神经网络、语音识别和知识图谱等等技术的理性呈现。
革命来临前夜,天秤两端的学与业
以上三位科学家仅仅是人工智能领域众多传火者的代表人物,却也能管中窥豹,领悟到一点人工智能产业发展的势头。
有一些生物学界的人士曾经对这次人工智能浪潮做出过忠告,说今天的人工智能特别像十几年前的生物学,论文满天飞、大学猛开专业、专家教授纷纷“下海”创业。最后生物学却因为产业化能力不足,湮灭了学术界的星星火光。而人工智能被称为下一次工业革命,自然要把“学”和“业”放在天秤的两端。
“学”的能力,既包括了论文数量、竞赛排名,也需要考量技术的创新型和实用性。
像现如今大火的DeepMind,他们发表的很多关于深度学习的论文中并没有利用太多超前的方法论,而是引源上个世纪的认知科学方法,用来解决今天的现实问题。
至于“业”的方面,往往要看技术的根扎在哪里。以上三个案例中,科学家们虽然都出身象牙塔和实验室,但也都是典型的工程派,把技术的根基深深的扎在了大企业和应用产业中。广泛的业务和广泛的应用场景意味着源源不断的现实数据,以此吸取的养分,才能让科学家们在仿真世界研发出的模型无限适用于物理世界,让技术切实影响到人们的生活。把工业革命的火种带到现实中来。
不过我相信人工智能产业很难重蹈生物产业的覆辙,一个显著的苗头就是,人们正在对天秤严重失衡的企业失去信心。比如此前的智能音箱风潮,市场上已经看不到前两年对智能手环一类产品的热情,反而换来了不少对智障音箱的嘲讽。又比如一直强调自己学术背景的科大讯飞,也因为落地场景匮乏而饱受争议。
历经了从。com时代的几次泡沫,我们已经越来越清楚自己想要的是什么,对于空中神殿的勾勒的确迷人,可想要真正改变现状,还需一次火种的传递。