伴随 iPhone X 发售,2017 年面部识别成为很多人关注的话题。你的脸越来越重要,它在替代曾经的指纹,让你解锁手机、进行支付,甚至玩有趣的 Animoji。
但从方便程度上来说,人脸识别和过去的指纹识别相比并没有太多提升,面对戴口罩、双胞胎等情况时甚至更不方便,可为何却有彻底取代指纹之势?是什么让人脸越来越重要?因为更好玩?或者更安全?或者其它原因?
这是个有趣的问题,但苹果在 iPhone X 上开始使用 Face ID,并为此不惜在额头添加「刘海」时,目的可不仅仅只是让你解锁或是好玩。也许你没有意识到,当生物验证方式从手指转移到人脸时,我们正踏上一条运用眼球、面部等多维度生物特征的新阶段。
不为人知的眼球「妙用」
最近外媒「quartz」曝出一项有趣的「防止手机被偷窥」技术,这项技术由 Google 开发:当你使用手机时,摄像头能够识别出周围谁在「偷窥」,并给偷窥者打上「吐彩虹」的表情,而且不需手机联网就能实现这一功能。
这一将眼球追踪和 AI 图像识别技术结合的功能,意味着手机摄像头不仅仅可以捕捉面部信息,同时也在捕获我们每个人的注意力。从前我们看手机的单向交互,正在变成手机和我们互相注视的双向交互,你可能没有注意到的眼球追踪,将有可能变化出非常多样的新能力。
眼球追踪的运用方式多种多样,防偷窥只是其中之一。人们很早就注意到除了手指外,人眼是另一个有机会「控制」设备的重要器官。今年八月极客公园曾经和大家介绍过,在微软的系统更新中,为了让那些患有 ALS(脊髓侧索硬化症)的用户方便使用,在 Win 10 系统中增加了用眼球直接「操纵」电脑的特性,通过眼球,就能进行包括左键单击、左键双击、右键单击以及取消的基本操作,这些身体不便的人可以用眼睛「打字」,甚至可以「滑动输入」,这一切都是源于人们长久以来对眼球追踪技术的探索。
从电脑到手机的变革,我们看到了越来越强的处理器和越来越丰富的感应元件加入,而伴随 AI 图像识别以及深度学习的能力提升,手机+眼球追踪具有了更丰富的想象空间。
「对眼球追踪能够了解用户注意力的重点及变化,从而完成一系列基于注意力分析的复杂任务,例如广告精准投放、在线教育学生状态分析等
应用都可以实现。」Face++工程师告诉极客公园,利用人工智能的分析能力,摄像头捕捉到的用户注意力以及表情动作将有多种多样的用法,比如在和他人聊天的过程中,当出现有意思的信息而捕捉到人的开心情绪时,输入框可以立即提供一个「微笑」的表情供用户发送出去。
想象一下,当你在手机上观看
视频时,注意到
视频中出现的某个手机,或者某个汽车,你的眼睛也许盯着看了很久,通过摄像头捕捉到的信息,在视频中途的广告时,你也许会看到这些你感兴趣的产品推荐。或者当你再看《动物世界》时,你盯着自己感兴趣的动物看时,就会立刻为你推送一条关于这个动物的百科资料或是趣闻,这一切都正随着眼球追踪技术和 AI 图像识别技术的发展变成现实。
教学场景的眼球追踪运用也很令人期待。我们很多人上学时也许都遇到过注意力不集中的情况,这并不是不爱学习,注意力集中的时间是有限的,有时候是需要休息,有时候要改变节奏。在传统课堂中,老师对于班级的同学可以「一览无余」,然后控制自己的讲课内容速度,但互联网海量知识内容的体系化,让越来越多人开始适应并习惯手机、平板等线上教学形式,但注意力如何集中的问题却不能很好解决。
在手机上对每个人面部和眼球进行追踪与分析,能获取到当前上课时的注意力情况,还有学生们的情绪反应,这样既能够及时调整课堂节奏,同时还能更好在线上互动,在今年八月,沪江网 HILL 实验室(Hujiang Intelligent Learning Lab)就带来了名为「堂果」的试验项目,通过手机摄像头捕捉到的学生注意力和情绪信息,老师们将能像传统课堂那样更好控制教学节奏,提升效率,在一个上万人甚至数十万人的线上课堂中,这一方式将对教学方式做出变革。
掀起感官交互变革
眼球追踪在手机上的成熟应用,离不开各项技术的成熟。
目前眼球追踪的实现手法有三种,但相关技术原理差别不大。Face++工程师告诉极客公园,手机前置摄像头可以根据用户眼球和眼球周边的特征变化进行跟踪,对捕捉到的人眼视线方向进行估计,计算并返回双眼眼球中心位置坐标,以及双眼视线方向向量,实现对人眼视线的追踪。包括前面提到的 Google 的方式,都是这种方式。这种方法的优势在于对设备要求不高,劣势在于黑暗当中前置摄像头会受到很大影响从而无法理想工作。
第二种和第三种,都选择利用虹膜追踪。不同的是,一种通过投射红外线等光束到虹膜来提取信息。后一种根据虹膜角度变化,进行被动追踪。目前在手机上使用虹膜识别的并不多,因此没有出现多种多样的应用,但利用红外线追踪虹膜的优势将能够在夜间更好追踪眼球信息,这也许会是未来手机的一个新方向。
不过,尽管视觉追踪技术为我们展现了人的眼睛和屏幕的全新交互,这其中仍然具有相当大的挑战。将技术上的可能变成实用的生活场景,这其中也有过失败的尝试,曾经在三星 Galaxy 手机上出现的眼球控制屏幕滑动的功能,就因为技术和体验的不一致而沦为鸡肋。
眼睛是注意力的焦点,不论手机、电脑、平板还是 VR、AR 等设备,几乎都离不开两个重要器官的参与:手和眼。在智能手机上,iPhone 开启了关于手指交互的全新维度,你可以双击放大,双指捏合缩小,滑动、点按等多种操作,这是触觉所能实现的多种可能。
人脸上包含的视觉、嗅觉、味觉等多种维度交互,现在正从面部识别开始一步步进化,眼睛不仅反映我们的注意力变化,还拥有人人各异的独特生物特征,毫无疑问,它的利用,将会进一步改变我们的生活。
从此以后,当你对着手机一颦一笑一皱眉时,手机都会更懂你。