AI训练师:教人工智能认识世界03:51
□ 中国妇女报全媒体见习 田梦迪
7月底,江西迎来高温红色预警,新余的最高气温已经超过40摄氏度,早上刚过8点,阳光就变得毒辣,穿过玻璃窗照射在上亿广场三楼的办公区域。
临近9点,这里逐渐热闹起来,各作业区的打卡电脑前排起了长队,摘掉口罩、人脸识别、打卡成功……500多名人工智能训练师陆续走到自己的工位,准备开始一天的工作。
90后二胎宝妈汤丽娟就是其中一员,只见她全神贯注地盯着电脑屏幕,左手操作键盘,右手移动鼠标,先画出一辆车的大体轮廓,然后将图片放至最大,细心调整车辆边缘的框线,再勾选屏幕左上角的车辆属性。
这样一整套流程下来,就标注好了这辆车的信息。汤丽娟边操作电脑,边向中国妇女报全媒体介绍,我们的工作主要就是在这些图像上标注数据,让人工智能可以通过这些数据更好地认识世界,从而为人类服务。
先尝试,才知道自己行不行
在人社部公布的国家职业分类目录中,汤丽娟从事的职业被认定为人工智能训练师(AI训练师),指使用智能训练软件,在人工智能产品实际使用过程中进行数据库管理、算法参数设置、人机交互设计、性能测试跟踪及其他辅助作业的人员,包含数据标注员、人工智能算法测试员两个工种。
这些话听起来很专业,但数据标注这个过程其实和平时带孩子有点像。从业两个多月,汤丽娟对这份工作有着自己的理解,我们就像一个‘翻译’,把采集到的图像、语音或视频‘翻译’成计算机语言,人工智能就像孩子,我们要不断用它能听懂的结构化语言带它熟悉真实世界,比如把障碍物、红绿灯、车道线等数据标注好了,人工智能就会通过这些信息慢慢学会自动驾驶。
说着,汤丽娟又完成了一帧画面的标注。看着她娴熟的操作,很难想象这位宝妈是一名才工作两个月的跨界新手。
汤丽娟(右一)在和同事讨论标注细节。中国妇女报全媒体 刘昱卓/摄
汤丽娟形容自己是个爱折腾的人,毕业十年间,她曾去过武汉、上海、杭州,做过和自己大学专业相关的针灸推拿工作,也曾因自己的进修计划从事过留学行业,回到新余之前,她在杭州做猎头。
我不喜欢给自己设限制,只要能通过面试,我都会尽力去试试。这是汤丽娟的人生哲学,成为人工智能训练师,也得益于这种不断尝试的勇气。
最初看招聘信息时,她敏锐地捕捉到了人工智能语音识别自动驾驶这些如今正火的关键词,本来还担心自己做不好,但看到身边的应届毕业生、宝妈们都能做,汤丽娟一下有了信心,先去尝试,才知道自己行不行。
百度智能云数据标注基地合作负责人魏冬告诉,基地中应届毕业生占比近两成,正式上手工作前会对员工进行整体的职业培训,使大家对人工智能产业链及自身的工种有整体认知,在每个项目开始前,也会对成员进行具体的业务培训,来帮助大家熟悉工作流程。
通过考试进入项目后,每个人每天要完成特定数量的标注任务。上班时间,基地作业区充斥着移动鼠标的声音,同事们偶尔起身到对方的屏幕前交谈几句,也会有审核的小组长来提返修意见。
在不断实践中提升正确率
画框、放大画面、调整框线、提交审核……下午一点半,汤丽娟回家吃过午饭后,重新坐在电脑前重复上午的操作,这样的矩形框,她每天要画600到1000个。
有时候,她觉得自己像工厂流水线上的一颗螺丝钉,每天坐在电脑前8个小时,在单一的工作场景中完成规定数量的任务。但在看似枯燥重复的操作中,她也收获了成长。
刚进项目时,汤丽娟每天只能处理100个矩形框,而且有一半都不能通过审核,有一次,我在画面上标注了十几辆车,但审核回来发现标注错误的红色小圈就有二三十个,比车还多。汤丽娟回忆起收到审核结果的那一刻,真的是深感挫败,明明认真标注了,结果却不尽如人意。
她点开每一个红色小圆圈,一一记录着出错的地方。不知道如何改正的,她及时和同事讨论、向老师请教。时间长了,汤丽娟心里像装着一个错题本。
画矩形框或者立体框的时候,要尽可能贴合车身,比如车窗玻璃和车身最高点的接缝处,误差要控制在两个像素以内才算合格。
选择车辆属性的时候,经常选完上一辆车的,就忘记修改了。
最难的是适当脑补,比如照片上只能看到车尾,但每个人对车头的想象都不同,就会导致标注出来的框线有很大差别。
……
细心、熟练、多交流,这是汤丽娟不断提升标注正确率的三大法宝,经过两个月的实践,她标注的正确率已经从不足50%提升至85%左右,在不断实践中提升正确率,让我很有成就感!汤丽娟说。
AI训练师被称为人工智能的老师,汤丽娟觉得这个比喻十分贴切,为数据贴上标签就是为了让AI机器人更容易识别数据,通过数据更好地认识这个世界。每次标注的正确率有所提升,她都觉得人工智能离感知真实世界又近了一步。
感激新基建催生新职业、新平台
今年5月,新余市政府引进百度智能云数据标注产业,在上亿广场三楼建立了7000多平方米的基地,如今,基地展厅大屏上的保护膜甚至还没来得及撕掉,各作业区已经坐满了员工。
魏冬介绍,基地员工中近80%为新余本地人。数据标注基地的建成,构建起了通往新一代信息技术的桥梁,帮助传统行业从业者更好实现职业转型,同时吸收大量应届毕业生、宝妈等劳动力,为这座城市提供了近千个就业岗位。
汤丽娟就是实实在在的受益者,原来的她从未想过,生完二胎重回职场能从事这样一份工作,离家很近,不用加班,可以拿到高于新余平均水平的工资。
而且,汤丽娟十分认可这份工作的未来发展,她知道,随着人工智能在智慧城市、智能制造、自动驾驶等各行各业的广泛应用,社会对人工智能训练师的需求将迎来爆发式增长。据人社部预计,2022年国内外相关从业人员有望达到500万。
最近,汤丽娟收到一个好消息,因为之前的项目数据断档,公司安排她去新项目做小组长。从行业小白到8人项目小组长,汤丽娟说:我很庆幸自己的选择和努力,更感激新基建催生的新职业、新平台。
这对我来说是很大的肯定。在基地,汤丽娟看到了未来清晰的成长路径,数据标注员可以通过提升标注正确率成为审核员,进而晋升为项目助理,直到独立负责一个完整的项目。或者像我一样,从标注员到小组长,继续做到项目经理,幸运的话甚至能成为公司合伙人。
更让汤丽娟感到满足和骄傲的,是看到家乡的道路上稳稳行驶着无人驾驶公交车,以前只觉得是高科技,现在每次见到,都会指给孩子看,告诉他‘妈妈的工作和这个有关’。
/ 手记 /
近年来,随着人工智能的快速发展,以前在电影中才能看到的高科技场面,越来越多地出现在现实生活中。到餐厅吃饭,上菜的人变成了送餐机器人;去超市买东西,收银台设置了自助结账机器;走上街头,无人驾驶的公交车在路面上稳稳行驶……人工智能的确强大,但这条产业链的基础,其实是海量杂乱的数据,而人工智能之所以变得如此聪明,离不开人工智能训练师的努力。
汤丽娟就是这样一位愿意尝试新事物的人工智能训练师,当很多人害怕自己的工作被人工智能替代时,她却提前转换赛道,承担起教人工智能认识世界、更好地为人类服务的使命。
其实,职业也是不断跟随社会发展而更新迭代的产物,一些职业的消失必然会催生新职业的需求,比如人工智能要实现自动驾驶,可能会缩减司机的需求量,但地图采集员、数据标注员等新岗位的需求会大幅增加。与其担心焦虑,不如提前准备。在这场变革中,汤丽娟用自己的经历告诉大家,或许想进入一个全新的领域并不容易,但先试试,才知道自己行不行。
AI训练师到底做什么?
我们做的,就是让人工智能更懂人类,更好地为人类服务。作为夸克搜索AI训练师,小寇是阿里巴巴业务生态中20万名AI训练师中的一员。
- 何为AI训练师?
根据人社部等联合发布的通知,这一职业是能够使用智能训练软件,在AI产品实际使用过程中进行数据库管理、算法参数设置、人机交互设计、性能测试跟踪及其他辅助作业的人员。
小寇向传播君介绍,AI训练师的主要工作是基于AI技术能力(包括图像、语音、对话等),面向用户及市场需求,针对产品应用,通过数据建设、标准制定推动算法技术优化,完成应用落地。
“AI训练师”是个啥职业?从业者为你揭秘!
你听说过AI训练师吗?今年2月,AI训练师正式成为新职业并纳入国家职业分类目录。这到底是个啥职业?有何发展前景?夸克搜索AI训练师小寇与我们分享了他的故事。