图源Pixabay
数据标注员们的工作并不轻松,他们需要面对枯燥无味的任务,低廉的收入,长期的不稳定和随时可能被取代的风险。他们是AI技术发展的基石,却很少得到关注和尊重。
据《Tech星球》报道,数据标注员们采用最原始的计件制算工资,大部分从业者每个月的收入都不过5000元。他们中有些人是专科毕业生,有些人是宝妈,有些人是转行者。他们在三四线城市的格子间里处理图片、文字、语音等数据,为互联网大厂和车企提供服务。
IT之家注意到,数据标注行业也经历了起伏。2017年,AI技术期望爆棚时,数据标注员们可以赚到高额收入,一个2D拉框就有5毛钱。但随着行业竞争加剧和技术发展不顺利,数据标注的单价越来越低,现在最低只有4分钱。
数据标注公司也面临着巨大的压力。他们需要具备一定的规模和资金储备才能从源头获取订单,并且要承担回款周期长、员工流动性大、质量和周期不稳定等问题。海天瑞声是目前数据标注行业内首家主板上市公司,去年利润率刚刚超过10%,今年上半年就陷入了亏损。
更让数据标注员们担忧的是,他们可能很快就会被自己参与创造的AI所取代。国内外都有一些公司正在开发可以自动标注数据的工具,利用市面上主流的大模型来对数据集进行标注。这些工具声称可以提高标注效率和降低成本,并且达到与人工相近甚至超过人工的准确率。
当然,并不是所有的数据标注都可以被AI取代。一些需要专业知识和逻辑分析能力的数据标注仍然需要人工参与,比如医疗、金融、自动驾驶等领域。但这也意味着行业的门槛将会不断提高,对于数据标注员们而言,要想在这个行业生存下去,可能需要更多的学习和努力。