本文转自:广州日报电脑前|人工智能训练师:我教AI如何“更懂”人类( 二 )


经验:要有核心算法还要“走出去”
张力文从小对数学、物理十分感兴趣 , 每天都会花很多时间钻研相关理论 。 2012年 , 张力文大学本科毕业 , 看到人工智能技术在国内兴起 , 诞生很多技术创新和应用创新 , 各种人工智能应用遍地开花 , 为此他决定继续攻读数字图像处理方向的研究生 。
视联网明厨亮灶、平安慧眼、天翼应急、智慧商企……这些人工智能应用项目张力文都“经手”过 。 让张力文印象深刻的是他负责的第一个项目 。 当时他带领一支应届生团队研发智能相册 , 由于缺乏产品设计、架构设计以及算法工程化落地相关经验 , 尽管在启动研发前技术方案已经改了10个版本 , 但在研发过程中还是遇到了很多不可预知的漏洞及问题 。 “项目需要研发人脸识别以及事物分类算法 , 我们直接使用了开源算法 , 结果项目完成后发现 , 人工智能分析的结果简直不堪入目 , 相片分类有很多错误 , 可以说是‘人工智障’ 。 ”后来张力文跟团队经过多个版本的迭代优化 , 才正式上线商用 。 “这个经历让我刻骨铭心 , 这说明我们要不断提升技术能力以及累积项目经验 。 商用项目不能过于依赖开源项目 , 我们要有自己的核心算法 , 才能做得更好 , 走得更远 。 ”张力文说道 。
为了让人工智能“学得更好” , 训练师有时候还要“走出去”调研具体的应用场景 。 比如明厨亮灶项目 , 要到厨房观察摄像头安装的位置和角度 , 摄像头拍摄的画面质量 , 厨房光线、摆放物品等 。 “我们都会做一些分析 , 分析会引起人工智能误判的因素 。 ”张力文说道 。
建议:求职者除了懂技术更要懂行业
“一个新开发的算法模型需要大量数据训练 , 这个时候就需要人工智能训练师介入和参与 。 ”天翼数字生活科技有限公司AI视联及行业应用事业部副总经理王艺指出 , 人工智能技术已经渗透到各个行业 , 包括工业、金融、教育、安防、市政、物流、交通等 , 这些行业对人工智能训练师都有着很高的需求 。 “现在有做AI的公司基本都有自己的人工智能训练师 , 随着人工智能在各个应用领域的不断拓展 , 数据标注和算法训练等工种存在较大的人才缺口 。 ”
人社部2020年发布的《人工智能工程技术人员就业景气现状分析报告》指出 , 经测算我国人工智能人才缺口超过500万 , 国内的供求比例为1:10 , 供需比例严重失衡 。 不断加强人才培养 , 补齐人才短板 , 是当务之急 。 广州市人工智能产业发展促进会执行秘书长蔡远尘介绍 , 协会连续四年进行广州市人工智能大数据企业入库工作 , 目前已累计入库800多家 , 其中大部分企业都是应用型传统企业转型而来 , 对人工智能人才有大量的需求 。
“找到合适的、了解某个应用领域的训练师还是很难 。 ”王艺指出 , 人工智能并非一个单一的产业 , 而是一项跨行业的技术 , “比如明厨亮灶的应用 , 需要针对厨房里不规范操作进行智能识别 , 这就需要了解食品安全相关规范的人员进行数据标注 。 所以 , 数据标注员要了解某个垂直行业的背景知识 。 ”
作为企业管理人员 , 王艺建议求职者不仅要了解算法调优、数据清洗、标注等基础知识 , 还要了解不同应用行业的背景知识 。 “只有了解行业 , 才能真正知道哪些数据需要标注 。 训练师既需要有逻辑思维、理性分析 , 还要有敏锐感、发现数据的能力 。 ”
“很多人认为人工智能可以完全替代人力解决所有的问题 , 但智能是一个不断优化的过程 , 需要人工辅助 。 ”张力文建议 , 有意入行的求职者要注重提升自身基础理论以及工程实践能力 , 持续关注前沿技术的发展动态;其次要做好个人的职业规划 , 结合个人的兴趣以及特长 , 定位从事人工智能的具体领域或模块 , 比如机器视觉、自然语言处理、语音识别等 , “做好定位后 , 要深入学习这些领域和分工涉及的软件、基本技能、数据处理常用手段等 。 ”