“你把手势汉语翻译得再精准也没用 , 聋人平时打的不是这个啊!”汲取了教训 , 这一次再建手语数据集 , 袁甜甜说 , 他们不求速成 , 只求每条语料都是原汁原味的自然手语 。 先按手语语序识别、再按口语习惯翻译 , 虽然多了一个技术环节 , 团队研发的难度也就长了一截 , 袁甜甜们却坚持要选择那条“难走但正确”的路径 。
“咱做这个研究 , 不想跟人吹我们的数据集有多大 , 也不想说我们发了多么高大上的论文 , 我们就一个目的:能用 。 ”袁甜甜斩钉截铁 , “这个系统出来了 , 聋人必须真的能用 。 ”
收获之年
对于袁甜甜和她的团队来说 , 2019年和2021年是两个关键的时间节点 。 2019年 , 是他们的初创之年 , “手语实时翻译系统”入选国家工信部新一代人工智能产业创新揭榜项目 , 获得了2000万的资金支持 。 袁甜甜很高兴 , 一方面是因为国家对无障碍建设的重视让她欣慰 , 另一方面 , 数据采集、技术研发、成果落地也确实是处处都要花钱 。
2021年 , 则可以说是团队的收获之年 。
闫思伊到现在还记得 , 今年年初她第一次跑通手语翻译系统代码框架时的心情 。 “就好像你在组装一台机器 , 零件都已经拼全了 , 但是因为各种各样的小毛病 , 比如说有几个螺丝没拧紧 , 它就是不能正常运转 。 我每天在实验室 , 一个一个地把螺丝给上紧 。 都调完之后 , 忽然有一天 , 我一按开关 , 机器就轰轰地转起来了 。 那种成就感啊……”
闫思伊在天津理工大学计算机学院读研二 , 是手语实时翻译项目团队的健听人成员 , 主要负责“后台”工作——构建手语识别算法框架模型 。 如果沿用教孩子学说话的比喻 , 学前阶段完成了反复加深印象的步骤 , 一上小学 , 孩子就要开始学习拼音、语法 , 学会按照教材上总结的规律 , 把学过、听过的那些单词组成句子和课文 , 写在作业本和卷子上——闫思伊就是编“教材” , 帮AI这位“同学”总结手语规律的“老师”之一 。
“这部分技术要求更高的工作 , 主要由我们学校计算机学院的师生来完成 。 ”袁甜甜说 , 给人工智能“编教材”的过程很艰辛 。 在手语识别、翻译领域 , 可借鉴的经验太少 , 同行的进度也都差不多 。 项目团队参考了德国天气预报自然手语翻译系统的算法 , 也通过各种渠道寻找类似系统在网络上公开发布的源代码 , 然后就是一遍遍地尝试和修正 。
闫思伊他们每天早上8点半就扎进机房 , 等意识到天黑该回宿舍 , 再看表已经是晚上10点了 。 “我觉得我们的项目有意义啊 , 就想快点出成果 , 能落地的成果 。 ”她说自己是个典型的理工女 , 就喜欢计算机 , 导师让周一到周五做项目 , 她周六日也忍不住去跑代码 。 就这样一点点摸索 , 一点点“紧螺丝” , 第一次跑通代码的那天早上 , 计算机“同学”在它的人类老师们面前 , 写下了一份不算完美 , 但成绩合格的手语翻译试卷 。
今年5月 , 王建源、乌力杰带着研究成果上了世界智能大会;10月 , 他俩又和聋人工学院其他几位同学组成创业团队 , 代表天津理工大学 , 拿下了第七届中国国际“互联网+”大学生创新创业大赛总决赛高教主赛道的金奖 。
他们的“夺金”项目叫“鲸可语” , 全称“鲸可语多模态连续手语自动标注识别系统” 。 自动标注识别就是手语翻译的前期步骤 , 而“鲸可语”正是依托“手语实时翻译系统”而生的——他们把两年来“教机器学手语”的经验转化成自己的科创项目 , 亲手为他们想象中那座“聋健融合之桥”建起了“桥基” 。
- 儿童教育|首个播放量破 100 亿的 YouTube 视频诞生,竟然是儿歌
- 东南亚|MIUI13深度使用报告,这还是我认识的MIUI吗?网友评价很真实
- 酷睿处理器|旗舰背后故事!1亿像素超清摄影+骁龙778G,你认为它适合什么人
- 降噪|苹果确认iPhone 13移除了电话降噪功能 此前机型均配有
- CPU|红米k50系列基本确认,整体安排跟k40差不多,双4nm芯片确实香
- 寒假来了!这节“交通安全”课,请认真看
- Flash弹窗广告卷土重来?3步定位,5步彻底关闭!手把手教程奉上
- 36氪|启中教育:如何实现店铺爆发式增长
- vivo|xplay6,音质好确实好,不过vivo我只认同这一部手机
- 欧菲光|郭台铭还没认清现实