手势|教AI认手语的年轻人( 五 )


“你把手势汉语翻译得再精准也没用 , 聋人平时打的不是这个啊!”汲取了教训 , 这一次再建手语数据集 , 袁甜甜说 , 他们不求速成 , 只求每条语料都是原汁原味的自然手语 。 先按手语语序识别、再按口语习惯翻译 , 虽然多了一个技术环节 , 团队研发的难度也就长了一截 , 袁甜甜们却坚持要选择那条“难走但正确”的路径 。
“咱做这个研究 , 不想跟人吹我们的数据集有多大 , 也不想说我们发了多么高大上的论文 , 我们就一个目的:能用 。 ”袁甜甜斩钉截铁 , “这个系统出来了 , 聋人必须真的能用 。 ”
收获之年
对于袁甜甜和她的团队来说 , 2019年和2021年是两个关键的时间节点 。 2019年 , 是他们的初创之年 , “手语实时翻译系统”入选国家工信部新一代人工智能产业创新揭榜项目 , 获得了2000万的资金支持 。 袁甜甜很高兴 , 一方面是因为国家对无障碍建设的重视让她欣慰 , 另一方面 , 数据采集、技术研发、成果落地也确实是处处都要花钱 。
2021年 , 则可以说是团队的收获之年 。
闫思伊到现在还记得 , 今年年初她第一次跑通手语翻译系统代码框架时的心情 。 “就好像你在组装一台机器 , 零件都已经拼全了 , 但是因为各种各样的小毛病 , 比如说有几个螺丝没拧紧 , 它就是不能正常运转 。 我每天在实验室 , 一个一个地把螺丝给上紧 。 都调完之后 , 忽然有一天 , 我一按开关 , 机器就轰轰地转起来了 。 那种成就感啊……”
闫思伊在天津理工大学计算机学院读研二 , 是手语实时翻译项目团队的健听人成员 , 主要负责“后台”工作——构建手语识别算法框架模型 。 如果沿用教孩子学说话的比喻 , 学前阶段完成了反复加深印象的步骤 , 一上小学 , 孩子就要开始学习拼音、语法 , 学会按照教材上总结的规律 , 把学过、听过的那些单词组成句子和课文 , 写在作业本和卷子上——闫思伊就是编“教材” , 帮AI这位“同学”总结手语规律的“老师”之一 。
“这部分技术要求更高的工作 , 主要由我们学校计算机学院的师生来完成 。 ”袁甜甜说 , 给人工智能“编教材”的过程很艰辛 。 在手语识别、翻译领域 , 可借鉴的经验太少 , 同行的进度也都差不多 。 项目团队参考了德国天气预报自然手语翻译系统的算法 , 也通过各种渠道寻找类似系统在网络上公开发布的源代码 , 然后就是一遍遍地尝试和修正 。
闫思伊他们每天早上8点半就扎进机房 , 等意识到天黑该回宿舍 , 再看表已经是晚上10点了 。 “我觉得我们的项目有意义啊 , 就想快点出成果 , 能落地的成果 。 ”她说自己是个典型的理工女 , 就喜欢计算机 , 导师让周一到周五做项目 , 她周六日也忍不住去跑代码 。 就这样一点点摸索 , 一点点“紧螺丝” , 第一次跑通代码的那天早上 , 计算机“同学”在它的人类老师们面前 , 写下了一份不算完美 , 但成绩合格的手语翻译试卷 。
今年5月 , 王建源、乌力杰带着研究成果上了世界智能大会;10月 , 他俩又和聋人工学院其他几位同学组成创业团队 , 代表天津理工大学 , 拿下了第七届中国国际“互联网+”大学生创新创业大赛总决赛高教主赛道的金奖 。
他们的“夺金”项目叫“鲸可语” , 全称“鲸可语多模态连续手语自动标注识别系统” 。 自动标注识别就是手语翻译的前期步骤 , 而“鲸可语”正是依托“手语实时翻译系统”而生的——他们把两年来“教机器学手语”的经验转化成自己的科创项目 , 亲手为他们想象中那座“聋健融合之桥”建起了“桥基” 。