数据标注产业是对数据进行筛选、清洗、分类、注释、标记和质量检验等进行加工处理,以海量数据作为原料,人才需求量巨大。
在贵安新区,集聚不少数据标注企业,2024年数据标注营收2.8亿元,同比增长44%,从业人数增长107%。
作为深耕数据人才培养与职业教育领域的佼佼者,贵州星长征教育科技有限公司(以下简称“贵州星长征”)于今年6月入选贵州省第六批产教融合型培育企业名单。今年9月,受邀参与工业和信息化部人才交流中心联合贵州省大数据发展管理局共同组织制定的《数据标注产业人才岗位能力要求》编撰工作,为行业标准的建立贡献智慧与力量。
产教融合:“学训践岗制”育人才
“这是9月9日刚入职的一批新员工,经过一个月培训,现在已经开始上手数据标注的工作,能完成简单的图片、文字、语音等原始数据标注,正在逐渐熟练掌握的过程中。”10月9日,来到位于贵安新区的贵州人工智能数据产业基地(贵安新区就业见习基地),项目主管龙鲜介绍道。
该基地由贵州星长征运营,聚焦人工智能数据应用领域,依托6所省内学校产教融合基地和贵安新区花溪大学城、清镇职教城等高校资源,专注于高素质技能型人才培养和职业教育产教融合发展,以“职业教育+升学服务+职业发展”为一体培养人才。
贵州人工智能数据产业基地(贵安新区就业见习基地)。
随着鼠标快速移动、点击屏幕,一个个物体的轮廓和位置被界定,属性被标明,在此起彼伏的“滴滴”声中,数据被一一清晰标注。
随着当前人工智能的崛起,数据标注员(人工智能训练师)作为一种新型职业应运而生,专门为人工智能模型训练提供训练数据服务。在此过程中,通过对图片、视频、语音和文本数据添加分类、画框、注释等,将标记后的数据成果用于算法模型训练,提高模型效果。
“训练好的算法模型可以运用到图像识别、语音识别、自动驾驶等不同领域。”贵州星长征产教融合部负责人王才萍介绍,企业建立人才选拔,企业文化培训,实操项目理论培训,实操项目技术培训,真实项目实操,人工智能训练师考证、实习、见习、就业、创业模式,培养产业人才。
在贵州星长征与贵阳人文科技学院大数据与信息工程学院共同打造的产教融合数据标注实习实训基地,几十名大三、大四的学生在项目主管郭晗的指导下,正迅速掌握数据标注技能。
“基地主要的项目有3D点云分割、3D行车AI培训、4D点云车载智能AI等。”郭晗介绍,实习实训的过程中以产教融合项目化管理,采用“学训践岗制”人才培养体系,培养责任心强、交付能力高的产业人才。
内部孵化:从就业者变创业者
与贵州人工智能数据产业基地(贵安新区就业见习基地)位于同一栋办公楼的贵阳贵安数据标注产业孵化基地(以下简称“产业孵化基地”),由贵州星长征和贵州贵安商业资产运营管理有限公司联合打造运营,占地3000平方米。
“基地目前共有7家数据标注企业入驻,其中既有贵州星长征的内部员工创业孵化的企业,也有省内外比较成熟的数据标注企业因受基地吸引而落户于此。”基地负责人、贵州星长征负责人彭启练介绍。
贵阳贵安数据标注产业孵化基地。
“当时,我把自己想要创业的想法跟公司沟通后,公司十分支持,并与我签订了内部孵化协议。”回忆起去年的场景,贵州黔晟智星科技有限公司(以下简称“黔晟智星”)总经理卢黔豪感觉“历历在目”。
作为贵州星长征内部孵化的第一家公司,成立仅一年时间,黔晟智星从初创时期的10人团队发展到现在近40人的规模。“以前作为贵州星长征的项目主管,现在作为公司负责人,在管理和专业技能上有了更大的提升。”卢黔豪说,公司入驻基地后,在技术上也得到了相应的支持,加上自己曾在行业内从业积累了相关经验,逐渐培养起自己的人工智能训练师团队,“目前主要承接基地洽谈的项目,包含2D、3D、4D标注在内的无人驾驶汽车图像标注业务,省去了不少市场开发和业务洽谈的成本。”
贵州黔晟智星科技有限公司总经理卢黔豪指导员工工作。
彭启练介绍,基地为创业者提供低价格的场地,企业可以实现“拎包入住”,降低其前期投资和创业风险,“省里对数据产业发展十分重视,我们希望能以打造这个基地为契机,带动相关产业发展,助力大学生就业创业以及生态伙伴共同成长。”
新入场者:抓住机遇向“新”而行
“用拉框技术,界定它的位置和轮廓,再填写相应的属性信息……”9月22日,在产业孵化基地入驻的另一家企业——贵州探境科技有限公司(以下简称“探境科技”)里,项目经理罗宗鑫正在指导新员工对图像进行标注。
“雨天、雾天、晴天等各个复杂天气中,红绿灯的状态都需要标注清楚,道路上模糊的部分也要进行区域分割。”罗宗鑫说,目前正在进行的是车外智能驾驶项目,后续可能会有一些延伸到车内智能驾驶标注的项目,“比如对驾驶人踩刹车、油门的力度,是否玩手机、聊天等动作进行属性标注。”
贵州探境科技有限公司项目经理罗宗鑫指导员工进行数据标注工作。
曾在贵州星长征就职的罗宗鑫,从人工智能训练师成长为负责百人团队的项目经理,后加入探境科技担任项目经理,负责运营管理、人才培训、人员分配等业务。
“行业发展潜力大、机会多,在无人驾驶、低空经济等领域应用广泛,不管是工业制造,还是我们平常的生活出行,都与此息息相关。”罗宗鑫说,自己想在行业内持续深耕,这与公司创立者、探境科技总经理杨食其的想法不谋而合。他在去年因机缘巧合来到贵州星长征学习两个月后,萌生了“入场”数据标注产业的想法。
“基地在管理、财务、产教联盟、项目、商务等各方面都比较完善,也能提供硬件设施、技术支持与培训资源等,助力我们初创企业快速成长。”杨食其说,公司目前主要通过基地承接智能驾驶类业务,基地给予不少技术支持和人才培养方面的帮助,“公司成立至今有团队成员36人,为高校毕业生提供了一些就业岗位,我们根据项目需要不断打造和磨炼团队,提升专业技能,计划将团队规模扩大到50人以上,这样才有‘硬条件’去承接更全面的项目,或是从承接项目分支升级为承接总包项目,争取更好的市场机遇。”
“传统的数据标注产业属于劳动密集型产业,准入门槛较低。未来基地将努力向医疗、法律、保险、金融等数据标注精度更高的领域发展,吸引和培育专业人才,加强校企合作,加快向技术密集型转型。”彭启练表示。