首页 / 科技 / 广东:人工智能训练师教AI如何“更懂”人类
返回

广东:人工智能训练师教AI如何“更懂”人类

浏览次数:404 分类:科技

智慧安防、智慧物流、智能交通……人工智能技术正让我们的生活更便利。而让人工智能(AI)“更懂”人类的新职业——人工智能训练师在当中起到十分重要的作用,相当于人工智能的教练。

人工智能训练师在2020年正式成为新职业并纳入国家职业分类目录。随着2021年底该职业的国家职业技能标准颁布,业内开展职业培训和人才技能评价有了基本依据。人社部发布的报告显示,经测算我国人工智能人才缺口超过500万人。近日,记者采访了解到,在广东,人工智能训练师的需求旺盛。

训练:“喂数据”图片数以万计还要避免AI“背题”

给人工智能“喂数据”,让其“长智慧”是人工智能训练师的主要工作。日前,记者在天翼数字生活科技有限公司见到了正在给人工智能“喂数据”的张力文,研究生毕业后他便进入公司从事机器视觉相关的算法研发工作,至今已有七年时间。

“我的日常工作主要包括人工智能需求分析、数据标注、算法开发以及算法调优等,其中数据标注和算法开发是最主要的工作。”电脑前,张力文向记者演示了一个火情识别算法模型的数据标注及模型训练的过程。只见他在电脑用标注工具将图片中的火焰逐一圈出来,并标注为“fire”,标注一定数量后将这些图片数据“喂”给人工智能学习,学习后进行测试,再逐张查看人工智能识别火焰的结果是否正确。张力文发现,人工智能将图片里的黄色盒子误判成“火焰”了,于是他把该黄色盒子重新标注为“非火焰”,对算法进行调优,再对人工智能进行迭代训练,如此往复……

每训练一次,系统会自动生成一次测试结果,在训练两三百次之后形成有多个指标结果的“loss曲线”图,loss值是判断“智能还是智障”的关键指标。“我们主要查看两个指标来判断人工智能是否需要重新学习。”张力文说,一般来说他们会查看人工智能“训练集”和“测试集”的正确率,如果训练集数据正确率高,但测试集的低,那么说明人工智能存在“背题”的情况,需要再次学习,如果两者正确率都高,说明人工智能已经“学会”。

张力文介绍,一个算法模型的训练,少则需要5000—10000张图片数据,多则要几万张甚至几十万张图片数据,“像目标检测一般一万张图片数据即可,但识别类算法,比如人脸识别,通常要几十万张图片数据。”

经验:要有核心算法还要“走出去”

张力文从小对数学、物理十分感兴趣,每天都会花很多时间钻研相关理论。2012年,张力文大学本科毕业,看到人工智能技术在国内兴起,诞生很多技术创新和应用创新,各种人工智能应用遍地开花,为此他决定继续攻读数字图像处理方向的研究生。

视联网明厨亮灶、平安慧眼、天翼应急、智慧商企……这些人工智能应用项目张力文都经手过。让张力文印象深刻的是他负责的第一个项目。当时他带领一支应届生团队研发智能相册,由于缺乏产品设计、架构设计以及算法工程化落地相关经验,尽管在启动研发前技术方案已经改了10个版本,但在研发过程中还是遇到了很多不可预知的漏洞及问题。“项目需要研发人脸识别以及事物分类算法,我们直接使用了开源算法,结果项目完成后发现,人工智能分析的结果简直不堪入目。”后来张力文跟团队经过多个版本的迭代优化,才正式上线商用。“这个经历让我刻骨铭心,这说明我们要不断提升技术能力以及累积项目经验。商用项目不能过于依赖开源项目,我们要有自己的核心算法,才能做得更好,走得更远。”张力文说道。

为了让人工智能“学得更好”,训练师有时候还要“走出去”调研具体的应用场景。比如明厨亮灶项目,要到厨房观察摄像头安装的位置和角度等。“我们都会做一些分析,分析会引起人工智能误判的因素。”张力文说道。

建议:求职者除了懂技术更要懂行业

广州市人工智能产业发展促进会执行秘书长蔡远尘介绍,协会连续四年进行广州市人工智能大数据企业入库工作,目前已累计入库800多家,其中大部分企业都是从应用型传统企业转型而来,对人工智能人才有大量的需求。

天翼数字生活科技有限公司AI视联及行业应用事业部副总经理王艺提出,人工智能并非一个单一的产业,而是一项跨行业的技术,“比如明厨亮灶的应用,需要针对厨房里不规范操作进行智能识别,这就需要了解食品安全相关规范的人员进行数据标注。所以,数据标注员要了解某个垂直行业的背景知识。”

 

点击取消回复

    分类

    在线客服x

    客服
    顶部 回到顶部