临近9点,这里逐渐热闹起来,各作业区的打卡电脑前排起了长队,摘掉口罩、人脸识别、打卡成功……500多名人工智能训练师陆续走到自己的工位,准备开始一天的工作。
“90后”二胎宝妈汤丽娟就是其中一员,只见她全神贯注地盯着电脑屏幕,左手操作键盘,右手移动鼠标,先画出一辆车的大体轮廓,然后将
图片放至最大,细心调整车辆边缘的框线,再勾选屏幕左上角的车辆属性。
“这样一整套流程下来,就标注好了这辆车的信息。”汤丽娟边操作电脑,边向中国妇女报全媒体记者介绍,“我们的工作主要就是在这些图像上标注数据,让人工智能可以通过这些数据更好地认识世界,从而为人类服务。”
“先尝试,才知道自己行不行”
在人社部公布的国家职业分类目录中,汤丽娟从事的职业被认定为“人工智能训练师”(AI训练师),指使用智能训练软件,在人工智能产品实际使用过程中进行数据库管理、算法参数设置、人机交互设计、性能测试跟踪及其他辅助作业的人员,包含数据标注员、人工智能算法测试员两个工种。
“这些话听起来很专业,但数据标注这个过程其实和平时带孩子有点像。”从业两个多月,汤丽娟对这份工作有着自己的理解,“我们就像一个‘翻译’,把采集到的图像、语音或
视频‘翻译’成计算机语言,人工智能就像孩子,我们要不断用它能听懂的结构化语言带它熟悉真实世界,比如把障碍物、红绿灯、车道线等数据标注好了,人工智能就会通过这些信息慢慢学会自动驾驶。”
说着,汤丽娟又完成了一帧画面的标注。看着她娴熟的操作,很难想象这位宝妈是一名才工作两个月的跨界新手。
汤丽娟(右一)在和同事讨论标注细节。中国妇女报全媒体记者刘昱卓/摄
汤丽娟形容自己是个“爱折腾”的人,毕业十年间,她曾去过武汉、上海、杭州,做过和自己大学专业相关的针灸推拿工作,也曾因自己的进修计划从事过留学行业,回到新余之前,她在杭州做猎头。
“我不喜欢给自己设限制,只要能通过面试,我都会尽力去试试。”这是汤丽娟的人生哲学,成为人工智能训练师,也得益于这种不断尝试的勇气。
最初看招聘信息时,她敏锐地捕捉到了“人工智能”“语音识别”“自动驾驶”这些如今正火的关键词,本来还担心自己做不好,但看到身边的应届毕业生、宝妈们都能做,汤丽娟一下有了信心,“先去尝试,才知道自己行不行”。
百度智能云数据标注基地合作负责人魏冬告诉记者,基地中应届毕业生占比近两成,正式上手工作前会对员工进行整体的职业培训,使大家对人工智能产业链及自身的工种有整体认知,在每个项目开始前,也会对成员进行具体的业务培训,来帮助大家熟悉工作流程。
通过考试进入项目后,每个人每天要完成特定数量的标注任务。上班时间,基地作业区充斥着移动鼠标的声音,同事们偶尔起身到对方的屏幕前交谈几句,也会有审核的小组长来提返修意见。
“在不断实践中提升正确率”
画框、放大画面、调整框线、提交审核……下午一点半,汤丽娟回家吃过午饭后,重新坐在电脑前重复上午的操作,这样的矩形框,她每天要画600到1000个。
有时候,她觉得自己像工厂流水线上的一颗螺丝钉,每天坐在电脑前8个小时,在单一的工作场景中完成规定数量的任务。但在看似枯燥重复的操作中,她也收获了成长。
刚进项目时,汤丽娟每天只能处理100个矩形框,而且有一半都不能通过审核,“有一次,我在画面上标注了十几辆车,但审核回来发现标注错误的红色小圈就有二三十个,比车还多。”汤丽娟回忆起收到审核结果的那一刻,“真的是深感挫败,明明认真标注了,结果却不尽如人意。”
她点开每一个红色小圆圈,一一记录着出错的地方。不知道如何改正的,她及时和同事讨论、向老师请教。时间长了,汤丽娟心里像装着一个错题本。
“画矩形框或者立体框的时候,要尽可能贴合车身,比如车窗玻璃和车身最高点的接缝处,误差要控制在两个像素以内才算合格。”
“选择车辆属性的时候,经常选完上一辆车的,就忘记修改了。”
“最难的是适当脑补,比如照片上只能看到车尾,但每个人对车头的想象都不同,就会导致标注出来的框线有很大差别。”
……
“细心、熟练、多交流”,这是汤丽娟不断提升标注正确率的三大法宝,经过两个月的实践,她标注的正确率已经从不足50%提升至85%左右,“在不断实践中提升正确率,让我很有成就感!”汤丽娟说。
AI训练师被称为人工智能的“老师”,汤丽娟觉得这个比喻十分贴切,“为数据贴上标签就是为了让AI
机器人更容易识别数据,通过数据更好地认识这个世界。”每次标注的正确率有所提升,她都觉得人工智能离感知真实世界又近了一步。
“感激新基建催生新职业、新平台”
今年5月,新余市政府引进百度智能云数据标注产业,在上亿广场三楼建立了7000多平方米的基地,如今,基地展厅大屏上的保护膜甚至还没来得及撕掉,各作业区已经坐满了员工。
魏冬介绍,基地员工中近80%为新余本地人。数据标注基地的建成,构建起了通往新一代信息技术的桥梁,帮助传统行业从业者更好实现职业转型,同时吸收大量应届毕业生、宝妈等劳动力,为这座城市提供了近千个就业岗位。
汤丽娟就是实实在在的受益者,原来的她从未想过,生完二胎重回职场能从事这样一份工作,“离家很近,不用加班,可以拿到高于新余平均水平的工资。”
而且,汤丽娟十分认可这份工作的未来发展,她知道,随着人工智能在智慧城市、智能制造、自动驾驶等各行各业的广泛
应用,社会对人工智能训练师的需求将迎来爆发式增长。据人社部预计,2022年国内外相关从业人员有望达到500万。
最近,汤丽娟收到一个好消息,因为之前的项目数据断档,公司安排她去新项目做小组长。从“行业小白”到“8人项目小组长”,汤丽娟说:“我很庆幸自己的选择和努力,更感激新基建催生的新职业、新平台。”
“这对我来说是很大的肯定。”在基地,汤丽娟看到了未来清晰的成长路径,“数据标注员可以通过提升标注正确率成为审核员,进而晋升为项目助理,直到独立负责一个完整的项目。或者像我一样,从标注员到小组长,继续做到项目经理,幸运的话甚至能成为公司合伙人。”
更让汤丽娟感到满足和骄傲的,是看到家乡的道路上稳稳行驶着无人驾驶公交车,“以前只觉得是高科技,现在每次见到,都会指给孩子看,告诉他‘妈妈的工作和这个有关’。”
/记者手记/
近年来,随着人工智能的快速发展,以前在
电影中才能看到的高科技场面,越来越多地出现在现实生活中。到餐厅吃饭,上菜的人变成了送餐机器人;去超市买东西,收银台设置了自助结账机器;走上街头,无人驾驶的公交车在路面上稳稳行驶……人工智能的确强大,但这条产业链的基础,其实是海量杂乱的数据,而人工智能之所以变得如此聪明,离不开人工智能训练师的努力。
汤丽娟就是这样一位愿意尝试新事物的人工智能训练师,当很多人害怕自己的工作被人工智能替代时,她却提前转换赛道,承担起教人工智能认识世界、更好地为人类服务的使命。
其实,职业也是不断跟随社会发展而更新迭代的产物,一些职业的消失必然会催生新职业的需求,比如人工智能要实现自动驾驶,可能会缩减司机的需求量,但地图采集员、数据标注员等新岗位的需求会大幅增加。与其担心焦虑,不如提前准备。在这场变革中,汤丽娟用自己的经历告诉大家,或许想进入一个全新的领域并不容易,但先试试,才知道自己行不行。