近日,全球计算机视觉顶会 CVPR 2020(CVPR,即 IEEE 国际计算机视觉与模式识别会议)公布各大挑战赛结果,阿里巴巴(以下称“阿里”)获得四项比赛的世界冠军,其中,在难度最高的 DAVIS( Densely Annotated Video Segmentation,密集标注
视频分割 )挑战赛中,阿里提出了可以精准预测
视频目标位置的方法,并且首次以超过 80 分的成绩夺得第一名。
CVPR 是 AI 领域规模最大的会议,被誉为计算机视觉领域“奥斯卡”,其范围涵盖计算机视觉领域的前瞻学术研究和工业
应用,会议的研究成果体现着视觉 AI 领域研究的趋势。由于视频会议、直播等应用逐渐普及,2020 年顶级科技公司的研究成果逐步从图像延伸到视频领域,涉及视频压缩、视频分割、三维视觉等领域。
据介绍,阿里参加的四项比赛均为视频技术领域。在 DAVIS 挑战赛中,阿里达摩院团队率先实现突破,力压悉尼科技大学 ReLER 实验室,以 84.1 的分数获得了第一名,比 2019 年第一名的中兴和华中科技大学联合团队高出 7.4 分。 目前,阿里视觉 AI 技术已在全球率先实现大规模落地。例如,城市大脑、拍立淘、优酷视频等阿里集团内部业务场景均已大规模使用该技术;阿里 CT 影像 AI 已经服务全球 600 多家医疗机构,疫情期间已完成 50 余万例病例临床诊断。
而人工智能赋能的实体经济,也将为生产和生活带来革命性的转变。人工智能作为新一轮产业变革 的核心力量,将重塑生产、分配、交换和消费等经济活动各环节,催生新业务、新模式和 新产品。从衣食住行到医疗教育,人工智能技术在社会经济各个领域深度融合和落地应用。
同时,人工智能具有强大的经济辐射效益,为经济发展提供强劲的引擎。据埃森哲预测,2035 年,人工智能将推动中国劳动生产率提高 27%,经济总增加值提升 7.1 万亿美元。
目前,全球人工智能产业的生态系统正逐步成型。依据产业链上下游关系,可以将人工智 能划分为基础支持层、中间技术层和下游应用层。基础层是人工智能产业的基础,主要提 供硬件(芯片和传感器)及软件(算法模型)等基础能力;技术层是人工智能产业的核心, 以模拟人的智能相关特征为出发点,将基础能力转化成人工智能技术,如计算机视觉、智 能语音、自然语言处理等应用算法研发。
其中,技术层能力可以广泛应用到多个不同的应 用领域;应用层是人工智能产业的延伸,将技术应用到具体行业,涵盖制造、交通、金融、 医疗等 18 个领域,其中医疗、交通、制造等领域的人工智能应用开发受到广泛关注。
相比于基本元件运算速度缓慢、结构编码存在大量不可修改原始本能、后天自塑能力有限的人类智能来说,人工智能现在尚处于蹒跚学步的发展初期,但未来的发展潜力却远远大于人类。
在享受着人工智能便捷性的同时却也应该警惕科技给我们带来的新的挑战,当我们与机器的联系越来越紧密,我们把道路的记忆交给了导航,把知识的记忆交给了芯片,甚至两性
机器人的出现能帮我们解决生理的需求和精神的需求,于是在看似不断前进的、更为便捷高效的生活方式背后,身为人类的独特性也在机械的辅助下实现了不可逆转的“退化”。我们能够借助科技所做的事情越多,也就意味着在失去科技之后所能做的事情越少。
在人工智能应用越来越广的时下,我们还将面对与机器联系越发紧密的以后,而亟待进化的,将是在崭新的语境下,我们人类关于自身对世间万物的认知。