吴恩达称,百度在虚拟和现实结合领域上的重点是移动端的AR应用,并且已经打造了一个名为度视(Dusee)的AR系统。吴恩达介绍说,在地图场景、儿童教育、医疗和旅游等领域,AR都能有非常不错的应用,能为用户带来更多丰富的场景体验。
此外,吴恩达还认为AR的未来就是人工智能AI。“我们已经看到现在AR是图像和机器学习的技术,未来会有更多的场景和应用。比如未来如果用手机看这个小熊,你左手拿着手机,右手伸出去,想跟小熊交互,要打字就非常不方便。但如果你想跟这个小熊通过讲话来实现交互,就非常方便。所以,希望未来我们也会把语音和自然语音识别的技术放进这个AR系统。”
吴恩达演讲后,百度大客户部总经理曾华围绕智能营销实验室谈及AR和AI在营销方面的具体应用。
曾华称,人工智能时代下的营销就是“场景+技术”,百度可以利用技术在场景的基础上丰富广告营销形式。比如传统营销都是单一的文字、
图片,但不久将来可以利用技术实现立体化和声音效果,“大家可以在手机上文字输入某款车,就有那款车跳出你的手机跟你互动,你可以看到车的颜色,可以拖拉随着你展示车的细节,你也可以听到发动机的声音。”
此外,曾华还表示百度目前已经把AI技术应用到了营销和服务中,他解释说:“ 百度AI营销解决方案,这也是人工智能首次进入真实场景,我们把它放到KFC,KFC在上海开了一个旗舰店,我们小度
机器人成为你贴心的点菜人,你可以通过它进行智能点餐,把食物的制作过程全面向你展开,让你安心用餐。”(李根)
附百度首席科学家吴恩达AI-AR演讲实录:
吴恩达:谢谢大家,今天非常高兴在这里有机会跟大家讲AI-AR增强现实的技术。最近我们看到人工智能和AR的技术,在
电影里我们看到特工使用AR,其实这种技术,在百度做的很好的人脸识别技术可以很好的自动识别一个人的身份,人工智能变的越来越好,可以更好的理解世界,如果我们把人工智能和AR放在一起,和世界交互的界面,希望为用户展现更智能的世界。
在百度我们已经进入了一个人工智能的时代,所以,我们好几年前就在人工智能的发展有巨大的投入,我们有很多非常领先的人工智能的技术。我个人的意见对人工智能的未来充满信心,比如我们希望未来有陪伴机器人,也希望未来做个性化私教。这些项目都有很大的潜力,不过这些项目还是在研究的阶段,今天现在我们人工智能已经对百度产品有非常大的影响。
在百度我们最核心的人工智能技术有好几部分,包括图像、语音、自然语言处理,选择几部分和大家分享,让大家感受这些技术对AR,对增强现实的关系。
图像,左边这张图,现在的图像技术可以自动输出这张图是什么,如果中间那张图输入问题,我们的技术也可以自动输出答案,“冲浪板是什么颜色?”“黄色”输入右边的
视频我们也可以自动书橱“一只狗在盆里玩”。所以,技术深度的理解图片和
视频。
我们也做了很多有关人脸的技术,输入左边的图可以告诉你这个人是男是女,也可以预测他的年龄。人脸和OCR技术放在一起,可以做自动的认证。
除了图片技术,我们在百度做了很多3D感知的技术,给大家看看这些例子,我们在一个购物中心采集的数据,我们可以用这种3D技术来模拟购物中心。模型可以放进我们的AR里面。
我们的图像技术是怎样做的呢?我们图像技术大部分是机器学习平台,在百度机器学习大部分都是用这些神经网络。我们要训练最有效,最大,最好的神经网络,我们需要使用超级计算机。大家知道中国在全世界有最领先的超级计算机,我们在这些超级计算机实验的巨大的神经网络我们也有一个手机端的引擎可以把这些放进去,可以用手机得到非常有效的实时结果。
最后,在百度我们也做了很多有关语音的工作。其实现在在百度我们有很多产品,包括手机百度有一个非常有效的输入法。两年之前我们发现我们的语音识别准确率提升得非常快,给大家举个例子,(放一段语音),你们有听到他在讲什么吗?我们把这段语音放到语音识别系统,它会输出这句话“96368统一订烟平台”,一些短句的识别能力已经远远超过人的识别能力。
再听一段(放一段语音),我们的语音识别系统输出这句话“新白娘子传奇”,再听一次。
除了语音识别以外,我们也在做语音合成,情感小说合成,请大家听两段语音,第一段是人工智能的语音合成系统,第二段是最新最好的情感小说合成系统。请大家听。
(放语音)
我们依赖这些语音识别和语音合成的技术让用户更方便的用语音跟我们的产品交互。
在百度我们拿这些人工智能的技术放进去,AI+AR,我们的增强现实系统,AR把虚拟场景与现实场景完美融合,而且可以让人和场景实时交流。
Pokemon Go也是非常好的例子。
在百度我们建设了一个新的AR系统,我们叫“度视(Dusee)”,请吴中勤来做一个演示。
吴中勤:谢谢。很高兴给大家展示一下度视。首先,我打开,我们在画面上切换到现场画面,可以看到地上有一部城市地图的画面,当我们把它改造成一个AR,改造成一个虚拟的场地。同时,我们还可以对这样的场地有更多的操作,比如放大,效果还是非常逼真的。谢谢大家。
吴恩达:我们AR的结果是怎样做的呢?手机的传感器,包括手机的摄像头来理解场景,然后用图形技术来输出这种AR的结果。VR和AR有什么关系呢?VR就是可以让用户感知到虚拟世界,现在好几个公司都是在做VR硬件,这些硬件的好处就是可以让你双眼看到很多图片,有更好的3D感觉。在AR可以把虚拟世界和现实世界融合,而且可以让你看到现实世界和虚拟世界的交互。
在百度我们的重点不是这种VR、AR的硬件,我们的重点就是手机端的AR。有一些市场分析的文章估计在今天VR硬件卖了有一千万台左右,这一千万台最大的部分都是纸箱做的硬件,Pokemon Go下载量7500万,在百度我们的产品已经有数亿的用户,所以,我们用手机硬件可以把2C的技术放进百度产品就可以非常快的为数亿用户提供非常好的AR体验。
你们可能知道在美国Facebook公司投入20亿美金,它的CEO觉得移动端AR会最先普及。
我们讲了现在AR可以做到什么程度,我想跟大家讲讲AR的未来。我觉得AR在很多应用场景,比如可以用AR来做更好的搜索结果。如果你想买一台沙发,如果你用文字搜可以得到这种结果,这种结果是不错,可以发现哪里可以买沙发,需要多少钱。如果搜图片可能会得到更好的结果,因为这些图片让你理解这个沙发是怎么样的,未来用AR来搜是可以让你理解这台沙发在你的家会看到什么样可能改变它的颜色等等。
AR还有很多另外的场景,比如在家里我希望让儿童看到3D的动画,在医疗希望让医生更理解病情,在旅游希望看到历史建筑的旧貌。这些场景,这些技术我们怎样做呢?我觉得图像技术是AR的核心,现在可以是别人脸,而且拿到3D模型。我们更理解一个场景,我们可以为用户提供更丰富的AR体验。
我想给大家看最后一个例子,我们以图像为基础,就可以用AR得到更有趣的体验,用手臂来源展现AR。在这个位置用手机看自己的手,你打开手的时候就可以看到这个小熊,你手动来动去,小熊也还是呆在手中间,最后你关上你的手,这个小熊就会消失了。
最后我觉得AR的未来就是人工智能,我们已经看到现在AR是图像和机器学习的技术,我们这些技术做的越好我们就可以更理解场景,就可以提供更丰富的AR体验,未来如果用手机看这个小熊,如果你左手拿着手机,右手伸出去,如果你想跟这个小熊交互,如果你要打字就非常不方便。所以,如果你想跟这个小熊交互最方便的办法还是用讲话。所以,希望未来我们也会把语音和自然语音识别的技术放进这个AR系统。
在百度我们这几年来在人工智能发展巨大的投入,我觉得人工智能做的越好我们的AR就可以做的越好。所以,我希望未来会有更多的机会跟大家合作为用户提供更好的AR体验。谢谢大家!