之所以目前只有消费互联网公司在大规模应用AI算法技术,主要是在这三方面消费互联网公司都更具优势。
——朱鹏飞 天津大学智能与计算学部副教授
近日,知名人工智能学者吴恩达发表文章,阐述了他对于人工智能在传统行业中应用缓慢的理解。无论是刷短
视频时的个性化推荐,还是外卖配送时的耗时预估,或者是移动支付时的人脸识别,以算法为代表的AI技术在消费互联网行业被应用得“得心应手”。然而提到传统行业,人们却很难快速想起非常成熟的应用人工智能的典型案例。为何AI技术在传统行业的应用速度和范围远不如消费互联网等行业?
消费互联网行业应用AI更具优势
“AI技术的应用主要取决于数据、算力和算法。”天津大学智能与计算学部副教授朱鹏飞介绍,首先数据要达到一定的体量,这是应用的基础,此外算力也要能支持大规模的模型训练,而后算法方面需要达到一定的精度,端侧算力也要具备一定的推理能力。
之所以目前只有消费互联网公司在大规模应用AI技术,主要是在这三方面消费互联网公司都更具优势。
前些年短
视频并没有现在这么火爆,例如发展初期的淘宝,也并没有很强的用户黏性。而随着推送越来越精准,用户的体验感也得到了极大的提升,最终呈现井喷式的用户增长。
“精准推送主要依赖于算法精度的提升,而算法精度的提升又离不开海量的数据作为基础。”朱鹏飞解释,在这个单一的场景中,算法模型需要不断进化,终身学习。由于不是封闭数据环境,总有新的数据加入,算法模型需要不断通过学习进行调整、迭代升级,使其精度越来越高,形成一个良性循环。
“与此同时,虽然目前消费互联网行业在算法精度上已经上升到一定的高度,但相比一些传统行业的应用场景,消费互联网行业对于AI算法精度接受的阈值都比较低。比如短视频、淘宝偏好推荐、百度热搜关键词,只需要达到用户产生黏性的目的,只要有一定准确性,用户都可以接受。”朱鹏飞表示,相比之下,在很多传统行业,对于技术精度的要求就高得多。比如基于视觉的AI技术在人脸识别方面的应用,在高铁站、飞机场核实身份,1∶1的比对准确度要高达99.99%甚至更高才可以进行应用。
在算力方面,目前云端算力已经可以支持大规模模型训练和推理,比如短视频、淘宝推荐等。但在大量传统行业应用场景中,智能终端上的端侧算力还无法满足推理的实时性和准确性要求。
“相比于社交网络和电商系统,传统行业应用场景的封闭生态系统使得云端算力无法得到有效应用。”朱鹏飞举例说,以智能无人系统巡检为例,电力巡检、管道巡检、交通巡检、河道巡检以及光伏巡检等要求搭载在无人机和
机器人上的算力满足实时巡检要求,由于视频分析的模型复杂度较高,端侧往往无法实现精准高效的实时推理,轻量级网络在满足实时性的同时损失了识别精度。由于算法精度达不到使用要求,使得在很多场景中无法实现AI技术的应用。
传统行业应用AI面临三大挑战
吴恩达认为,在AI应用方面,消费互联网行业之外的其他行业都面临着三大挑战:数据集很小;定制化成本很高;从验证想法到部署生产的过程很长。
对此,朱鹏飞也深有感触,他以传统制造业为例进行了分析。
“传统制造企业在制造向智造转型的过程中,数据是一个很突出的问题。”朱鹏飞介绍,首先在数据的获取方面存在一定难度。传统制造企业的数据是封闭的,因为很多传统企业并不是新型信息化设备,没有传感器收集实时数据,也没有数据中心,因此数据零散,缺失严重,很难获取像消费互联网企业里那种海量、高质量的数据。
其次,行业内部各个工厂的数据很多具有商业价值,因此工厂都严格保密,这导致数据不流通,没有办法进行共享,进而形成了数据孤岛效应,影响了AI算法模型的优化。
“我们在开发一个AI算法模型的时候,因为数据的保密性,往往得到的数据都是经过‘脱敏’的,这也严重地影响了我们的判断。而传统行业的企业中,又缺乏具有AI算法模型开发能力的技术人员,因此双方在合作研发过程中也存在着很高的壁垒。”朱鹏飞说。
此外,传统行业中的数据来源并不像消费互联网领域那样来自单一场景,复杂的业务场景导致数据往往很“脏”,必须进行“清洗”,去掉大量无效信息,AI算法模型才能高效率的学习以提高精度。“这就像我们教小朋友知识,只讲知识点,小朋友们才能学得快,如果在知识点中夹杂着大量无用的信息,小朋友无从分辨,学习效率肯定降低。”朱鹏飞介绍,而给数据标注“知识点”的工作是巨大而繁琐的,需要企业有专人去做,要花费很多时间精力。
“传统制造业要想获得高质量的数据,就必须对生产设备进行信息化、智能化的改造。”朱鹏飞表示,这种改造需要企业投入大量的时间和精力,还会增加生产成本,这也成为AI在传统制造业中应用的壁垒。
高质量数据是应用前提
过去这10年,大部分AI的研发和应用是“以软件为中心”驱动的。在海量数据的支撑下,不断优化软件和算法,来获得更高的算法精度。在传统行业无法提高数据质量和数量的情况下,吴恩达认为,传统行业应该采用“以数据为中心”的模式,把重点放在获得质量更好、匹配度更高的数据上。
“在这种思路下,传统行业也涌现了一些不错的应用案例。比如医学领域的影像识别AI系统,可以帮医生‘看’CT影像片子,对肿瘤等病变加以识别,辅助医生做出判断。”朱鹏飞介绍,由于很多数据都由专业的放射科医生在影像片子上进行了标注,因此数据比较准确,AI算法模型在学习的过程中进步很快。目前很多影像识别系统的准确率都能达到90%以上,由于是辅助医生,最后还需医生做医疗决策,但这个水平的准确率在很大程度上降低了医生的工作强度。
“尽管传统行业有了一些应用AI技术的成功案例,但是要想更好地和AI结合,还得在提高数据质量方面下功夫。”朱鹏飞建议,首先对于已经积累了海量数据的传统行业,在保证数据安全的前提下,主动开放数据。挖掘数据中蕴藏的价值,和需求关联起来,会有很大的发展空间。其次,对于新兴行业,比如新能源汽车等,在构建智能工厂规划的时候,就把获取数据、智能化的因素考虑进去。
不过朱鹏飞强调,在传统行业用好AI技术的同时,也不要滥用AI技术,在应用前做好评估,如果不能提高生产效率,对行业整体有所提升,那么盲目强行使用AI技术,就是对资源的浪费。“比如一些应用场景需要AI算法达到99%以上的精度才可以使用,通过评估,现有模型算法只能达到90%的精度,那么这个场景就没必要强行上马AI技术了。”
“总而言之,对于AI技术的应用要数据先行,有高质量的数据再谈应用,没有好的数据很难有好的应用。”朱鹏飞说。