两月三秀人工智能技术实力
这已经是最近两个月时间里,百度地图第三次对外展示基于人工智能的数据生产技术。
7月29日,百度地图首次举办顺德数据中心媒体开放日活动,通用路段的全景采集汽车、供狭窄路段采集的电动自行车、供室内采集的点云背包,以及用作特殊采集的无人机采集装置采集设备等装备集中、公开亮相,令业界对百度地图强悍的自采能力刮目相看。其中,百度地图拥有业内最大规模的250辆采集车,首创单人“驾车+采集”作业模式,采集人员只需开车采集图像和回传照片影像,即可完成ADAS级别地图数据采集。借助室内图采集背包,单人就可以独立完成商场、酒店、机场、展览馆等室内全景图像采集。在内业制作上,百度地图借助语音识别、图像识别、大数据处理技术来加工道路信息和POI信息。以行业领先工艺颠覆传统的数据处理模式,采集完成的数据中有超过80%的工作都能实现自动处理。
9月1日,百度世界大会上,百度地图卓越的数据采集处理能力更是被李彦宏作为百度人工智能的一大典型应用进行现场演示,表示百度地图的全流程数据生产自动化程度已经超过80%,全景图像的自动化识别提取准确率高达95%,如同人的眼睛一样识别店铺名称、门牌号、停车场、营业时间等信息,从而让百度地图的数据无限逼近现实世界。
国内第一家采用全景实采工艺进行电子眼数据自动识别处理,国内第一家采用全景实采工艺做路口放大图……仿佛就在一夜之间,百度地图的数据生产力就迎来了跨越式的发展。
实际上,为了这一天的到来,百度地图已经默默地酝酿、储备了很久。
创新革命:几何级数爆发的“数据生产力”
驱动百度地图数据生产力几何爆发式提高的关键,就是人工智能技术。
曾几何时,“拥有国内最庞大的测绘团队、数据研发和生产人员”,还是地图商最引以为傲、用以证明其实力的最大资本。但是,对数据采集和处理人员来说,这也意味着极其庞大的工作量。例如,一个数据采集人员每逢要更新所负责区域的POI数据,就需要把最新的数据导在采集工具软件中,然后根据采集软件GPS定位判断此地名称、电话、门牌、商户类型等是否正确,反复核实,每天都会刷新运动步数纪录。
对于百度地图而言,基于长期不遗余力的积累,包括不断升级采集装备,投入相当的人力、物力自建数据中心,已经彻底颠覆了传统的数据采集模式。在香格里拉的数据采集媒体体验营上,百度地图生动演示了其首创的“多栖组合”采集模式,该模式将五大采集黑科技,包括全景采集车、采集自行车、全景采集背包、室内图采集背包、无人机进行多维组合,协同作战,结合“1+0”单人采集模式、Lidar点云系统全景采集等核心技术,采集人员可根据香格里拉丰富多样的地貌特征,包括山峰、河流、原野、道路、室内等,配备不同的装备和技术进行采集操作,立体式覆盖、一网采集所有类型数据。
用于道路采集的采集车是百度地图数据采集的主力军,之所以能够单人“驾车+采集”,除了因为可语音交互提高了采集人员的效率以外,还基于所搭载“GNSS+IMU”、成像系统、Lidar点云系统等核心设备,全面实现了采集自动化和集成化。“GNSS+IMU”主要采集定位信息,确保地图的精度;成像系统主要供采集影像和后期自动化识别POI使用;Lidar点云系统主要为高精道路使用,采集ADAS、HDMAP相关数据。在室内采集方面,百度地图在国内同样处于一骑绝尘的地位:自主研发了点云系统全景采集设备和内业制作平台,从而彻底摆脱了以往通过制图软件进行人工采集处理的方式,采集员只需要背着采集设备行进,即可自然而然地生成3D模型和平面图。
在数据处理环节,对应外业“多栖组合”采集模式,百度地图创造性提出了多组合数据制作模式。该模式利用图像识别、深度学习等人工智能技术打造出数据处理“三大刀锋工艺”:图像深度学习自动筛选功能,从采集的影像中快速自动识别道路特征、提取轮廓并绘制形状,补充车采盲区部分数据;全景图像自动识别技术,机器精准识别目前人工可目视的道路图形标牌、地面车标以及文字标牌;多源数据自动识别差分融合工艺,将外业实采的不同形式数据与合作数据等多源数据实现程序的自动识别差分、属性自动融合,从而减少人工工作量。同时,数据质量控制、全流程多工序数据自动化流转等方面的平台化创新,也大幅提高了数据生产作业的自动化比例,使整体生产效率达到业界先进水平。
技术是生产力的核心要素之一。依托先进的外业“多栖组合”采集模式与内业“多源融合”数据制作模式,2016年,百度地图数据采集处理效率提升了 10倍,数据更新也日新月异:道路阻断或者修路信息等要素实现了分钟级上线,新开通道路实现了每天上线更新,重要城市每周更新。
今天,百度地图已实现底层数据完全自采,覆盖全国所有城市,采集里程超过670万公里,拥有4500万个POI信息点,全景照片达7亿多张,数据资产位居全行业第一。更重要的是,这一组数据每时每刻都在以突飞猛进的速度不断增长。
“无数据,不地图”。在当前中国城镇化建设高潮迭起,地理环境信息快速变化的大背景下,数据覆盖多大范围、精准程度有多细致,更新频率有多快,将很大程度上决定地图能带给用户怎样的体验,直接影响地图商能够占据多大的市场份额。可以说,地图行业的竞争焦点就在于谁能更高效地采集和处理海量的地图数据,并从中挖掘更多深层价值,推出更多的智能化应用,让地图更好用、更易用。
而当匀速发展的传统数据生产模式,碰上人工智能基础上的数据自动化生产机制,其结果可想而知:根据易观千帆的最新数据,百度地图以71.4%的比例,稳居2016年第二季度中国手机地图APP活跃用户覆盖率的首位,这个比例是第二名高德地图的近两倍。
下一幕:人工智能驱动百度地图“强者恒强”
在数据生产力爆发式增长的背后,是百度地图颠覆行业、引领变革的强大势能——正如百度地图总经理李东旻所言,人工智能技术已经成为支撑百度地图不断发展的核心动力,推动百度地图从一个导航应用进化成为了“基于大数据的人工智能出行平台”,平均每天响应超过7000万次路线请求,提供超2亿公里导航服务,每天节省出行时间115万小时。
除了给亿万公众带来出行便利,作为国内最具影响力的开放地图技术提供者,百度地图还致力于提供全面的智慧交通解决方案,与各地交通主管部门深入合作,助力全国各省市的交通管理升级,推动智慧城市建设快速发展。目前百度地图已与江苏、广东、深圳、贵阳、西安、海口、成都等20多个省市达成了战略合作。此外,百度地图已向60万活跃APP以及网站开放技术平台,将人工智能的先进技术扩散到了社会生活的方方面面。
这为全社会将来实现智能化、高效化出行奠定了基石,也勾勒出更为宏大的远景。
在9月1日的百度世界大会上,李彦宏对互联网的发展阶段进行了新的解读,他认为,当前这一幕是移动互联网,但移动互联网的红利期已经基本结束,下一幕——“人工智能”的时代,已经到来。在这个时代,人工智能将成为诸多行业角逐的焦点。因为人工智能技术具有平台性和通用性特征、技术实现难度较大,行业竞争格局中的“先发优势”和“马太效应”将得到进一步放大,出行领域“强者恒强”的趋势将愈发明显。相比之下,因为缺乏深厚的技术积淀,同行业的竞争对手如果想要实现赶超,成功几率将更低。
未来,百度地图很可能将人工智能与AR结合,带给用户带来更快捷的导航指引、更直观的实景体验。借助于AR与周围真实环境进行实时的信息交互,用户可以更快捷地获得建筑物和商户的信息,并了解途经的所有物业。基于人工智能的技术和计算能力,百度地图如果发展AR技术,在物体识别、三维环境感知等方面已经占据了很大优势,能得心应手地运用复杂的计算机视觉和深度学习技术,对各类出行场景进行增强化处理。
还有百度地图与无人驾驶的结合,等等。百度自主采集和制作的高精地图记录了完整的三维道路信息,能在厘米级精度实现车辆定位。得益于人工智能,百度在高精地图方面的自动化生产程度达到90%,能自动识别交通标志、地面标志、车道线、信号灯等上百种目标,且准确率超过90%,是国内唯一具备规模化量产能力的高精地图商。
百度地图因为最先应用人工智能而受益,依托人工智能,百度地图已经首创4K地图、全景地图、高精地图,并以每三天上线一个新功能的速度快速迭代。
人工智能的大时代,百度地图又将作为“基于大数据的人工智能出行平台”,以更快的速度,让全社会从中受益。