嘈杂场景语音识别准确率怎么提?脸书:看嘴唇( 二 )


但是基于现实使用方面的考虑 , 有学者提出了一些担忧 。
其中 , 华盛顿大学的人工智能伦理学专家OsKeye就提到 , 对于因患有唐氏综合征、中风等疾病而导致面部瘫痪的人群 , 依赖读唇的语音识别还有意义吗?
对此 , Meta方面研究人员回应称 , AV-HuBERT方法更多关注于唇部动作 , 并非整个面部 。
而且与大多数AI模型类似 , AV-HuBERT的性能“与训练数据中不同人群的代表性样本数量成正比” 。
论文地址:
https://arxiv.org/abs/2201.02184
https://arxiv.org/abs/2201.01763
GitHub地址:
https://github.com/facebookresearch/av_hubert
参考链接:
嘈杂场景语音识别准确率怎么提?脸书:看嘴唇】https://venturebeat.com/2022/01/07/meta-claims-its-ai-improves-speech-recognition-quality-by-reading-lips/