作者:张田勘
刚刚出刊的2020年4月《自然-神经科学》杂志发表了美国加州大学洛杉矶分校研究人员的一篇论文,“使用编码器-解码器框架:大脑皮层活动到文本的机器翻译”。论文描述了一种能将人类大脑活动转为文本的人工智能(AI)系统。这一AI技术可在人大声说话时监测其脑电波(神经活动)模式,再将其转录为可读文本。
读懂人心并获取人们的思想一直是AI研究的一个领域和方向,AI被赋予高级“读心术”的重任,即不通过人的话语、肢体语言、面部表情,就可以通过探测其大脑语言中枢和其他功能中枢(如运动中枢)的脑电波,探查到人们在想什么、要说什么和想要进行什么样的活动。
实际上,这就是通过脑机接口,把检测脑电波(思维和思想)的电极装置植入大脑,再通过脑电波传送到AI软件,由后者破译脑电波,知道人们的想法或思维。AI破译的想法和思维既可以发送到假肢以帮助残疾人完成各种行为,如吃饭、穿衣和行走,像正常人一样生活,也可以转变成文字和语言,把人的想法写出来。
此次的AI系统也是在大脑植入了电极并在人大声说话时监测其脑电波,再将其转录为可读文本。有4名志愿者参加了试验,他们被要求多次朗读30-50个固定句子,电极记录下他们的大脑活动。
这些大脑活动的数据随后被输入到机器学习算法,后者每个句子的大脑活动数据转换成一串数字和字符串。AI系统从这些大脑活动数据再推导出声音,并和实际记录的音频进行比较。数字和字符串则被再次输入到AI系统,转换成一个单词序列。起初,系统会写出无语义的句子。但是当AI系统将每个单词序列与实际朗读的句子进行比较时,AI得到改进,学会了数字字符串与单词的关系,以及哪些单词是有上下文关系的,因而写出的句子与说话者朗读的句子相似。
实际上,这是采取机器翻译类似的算法。机器翻译是将文本从一种语言到另一种语言的算法翻译,但此项研究是将输入AI的文本变成了脑电波信号。而且最后的结果表明,AI系统的准确性因人而异,其中一位志愿者朗读并由AI记录脑电波转换后,平均每个句子只有3%需要纠正,高于速记员5%的单词错误率。
言语是个体表达思想的介质,其中有许多规律,如语音的高低、语速、说话时的停顿、语法、词汇、个人用词习惯、句势、句子的长短等。在大脑置入电极让AI能记录一个人说话时的脑电波(神经活动),也是让AI进行深度学习。
不过,这项技术现阶段看并不成熟,仍然存在一定的错误率,且暂时只能处理少数句子。最大的问题在于,这一技术成熟后是否能广泛
应用于人类,尤其是会不会成为监控人思想的工具?每个人每天都会说无数的话,在会议上发言,与亲朋好友聊天,还有打电话,如果利用这种AI系统,尤其是手机中可以置入这种AI软件时,可能会带来危险,如经济泄密、个人存款和商业损失等,甚至成为监控人行为的工具。
为了防止上述情况出现,应当有两方面的伦理规范和立法。首先,AI设计和生产者需要在这类软件应用于人的手机、电脑等多种信息终端时提出知情同意和尊重隐私条款,不得强行安装。
其次,这类AI本质上还是要进行脑电波的收集和破译人们说话时的大脑神经活动(脑电波),对此应该有法律方面的限制。是否可以收集正常人的脑电波?如果可以将以什么方式进行?收集人的脑电波有两种方式,一是脑机接口,即在大脑表层或内部植入电极,二是佩戴电子帽,其中有脑电图扫描仪(EGG),可以激活大脑皮层的语言中心并收集该中枢的生物电信号。无论哪种方式都需要进行反复论证,探讨其可行性,保证AI收集和解读的想法不能泄漏和被任何第三者利用。