日前,阿里大文娱集团联合阿里巴巴达摩院共同发布了名为“鲸观”的全链路数字版权服务平台。据悉,该平台通过搭载达摩院iDST(数据科学技术研究院)的人工智能技术,可实现对视频的智能编辑,同时在音视频素材上抽取“指纹”,让其在全网范围可追溯。
这也是阿里达摩院自成立以后,研究成果的首次落地。阿里巴巴达摩院iDST首席科学家兼副院长任小枫告诉21世纪经济报道记者:“马老师(指马云)给我们定的目标非常高,我们要做的就是解决未来的问题。”其中就包括视频行业的版权保护问题。
解决盗版难题
近年来,视频行业得到了迅猛的发展。据中国互联网络信息中心第40次《中国互联网络发展状况统计报告》显示,截至2017年6月,中国网络视频用户规模已达到5.65亿。
与之对应的是视频数量的爆发。据今日头条创始人张一鸣近日表示,仅今日头条旗下的平台,每天就有超过2150万条短视频上传。但是,随着行业的迅猛发展,“搬运工”、“剪刀手”等侵权现象也变得日益突出,如何更高效地进行版权保护,成为视频行业发展的当务之急。
任小枫告诉21世纪经济报道记者,指纹对于视频的版权保护来说非常重要。如果能够像指纹一样去计算视频的精确特征,那就可以对每一个视频实现唯一的匹配。
以往,侵权者会通过加logo、压缩分辨率或者调整亮度等一系列操作来改变某一视频的特征。“但通过指纹技术,就能够在各种各样的变化中找出他们,现在我们已经可以去分辨多场景的视频,且准确率在99%以上。”任小枫说。
实现这一成果的背后,人工智能功不可没。据悉,鲸观平台在处理视频时,会利用达摩院iDST的人工智能技术对视频内容进行各个维度的分析,并为之打上两万余种标签,同时利用知识图谱对标签进行多维度编目。这样一来,视频内容就变得可识别和搜索了。
另据21世纪经济报道记者了解,除了精准的识别技术外,鲸观平台在视频处理效率上也实现了突破。目前,其通过一台机器就可以处理近30万小时的视频。
任小枫告诉记者,这是因为该平台采用了一个“二值”的索引引擎。简单来说,就是把视频所有的变化都转化成“二值”,即零或一,这样便能简化视频的指纹特征,使得存储和计算速度得到大幅提升。
目前,鲸观平台上视频的下载、解码、编码都能够达到毫秒级的处理速度,5分钟时长的视频经过上述全链路处理可在10秒内完成。更为重要的是,在这个过程中,视频的精度不会损失,和原始特征一模一样。
视频技术接近美国
今年6月,任小枫加入阿里担任阿里巴巴iDST首席科学家和副院长。资料显示,iDST是阿里巴巴负责人工智能技术研发的核心团队,成立于2014年,由一批杰出的科学家及工程师组成,分布在杭州、北京、西雅图、硅谷等地。
而在此之前,任小枫是亚马逊级别最高的华人科学家。他从2013年开始任职于亚马逊无人零售店Amazon Go部门,并领导计算机视觉算法团队。因此,其对计算机视觉领域中的图像分类、物体识别、跟踪、检测、事件检测等均有全面且深入的理解。
任小枫告诉21世纪经济报道记者,对于视频技术,他有很多期望,这次与阿里大文娱一起发布鲸观平台,也是希望视频技术在这个平台上能够得到锻炼和提高。
加入阿里以后,任小枫仍专注于计算机视觉领域的研究,并主攻图像视频内容的识别和理解。在他看来,目前的工作内容其实与在亚马逊并无太大差异,都是对动态的人体或者物体进行检测,同时对其姿态、动作进行分析等。
从技术角度来说,动态的视频要比静态的图片更加难以识别和分析。以人脸识别为例,在视频中就可能会受到分辨率、角度、距离等因素的影响。“为解决这些问题,我们选择使用超深卷积网络,并对模型简化加速,从而实现精准的人脸检测、跟踪、识别。” 任小枫说。
但对于这位技术大牛而言,他脑海中对视频的理解,并不是简单的给视频加上一些标签,而是要能对视频内容更加细致的理解和分析。比如有些视频的人物、场景都无法识别,但可以分析他们的关系;或者可以对一些动作、行为进行识别和分析。这也将是阿里巴巴iDST未来要研究的方向。
任小枫坦言,视频技术正处于快速发展的阶段,他自己也在思考,除了提升现有的一些技术应用外,还有没有新的领域可以进行探索。
而在谈及中美的技术差异时,他告诉记者,中国在人工智能技术上与美国其实还是有一些差距,不过,在人脸和图像的识别技术上,这个距离已经非常接近。