|情感语音转换技术研究取得新进展
采访人员23日从内蒙古大学计算机学院获悉 , 该院刘瑞研究员所在科研团队与日本大阪大学科学与工业研究所科研团队合作 , 在国际信号处理领域TOP期刊《IEEE/ACM音频、语音和语言处理会刊》发表了“通过源滤波网络将独立于说话人的情感解耦以进行语音转换”的最新研究成果 。
据介绍 , 情感语音转换(VC)旨在将中性语音转换为情感声音 , 同时保留语言信息和说话者的身份 。 科研团队注意到 , 将情感特征与其他语音信息(例如内容、说话者身份等)解耦是实现高质量转换效果的关键 。 由于情感语音中声学特征的解耦更加复杂 , 面向中性语音的特征解耦一直无法得到很好的处理 。
科研团队针对情感语音转换的声学特征解耦问题开展研究 , 提出了一种基于“源—滤波器”模型的情感语音转换系统 , 具体来说 , 是为了解决情感语音转换的特征解耦问题而提出一种新颖的基于“源—滤波器”模型的情感VC模型(简称SFEVC) , 以从音色和音调特征中准确过滤说话人独立的情感线索 。 SFEVC模型由多通道编码器、情感独立编码器、预训练的说话人相关编码器和相应的解码器组成 。 所有编码器模块都采用信息瓶颈自动编码器 。
【|情感语音转换技术研究取得新进展】为了进一步提高各种情绪的转化质量 , 研究团队还提出了基于二维VA(激活度—效价)空间的训练策略 。 实验结果表明 , SFEVC模型以及VA训练策略的表现均优于所有基线系统 , 并基于非平行数据在说话人无关的情感VC场景下实现了最优性能 。 采访人员张景阳 通讯员胡红波
- 视频怎么转换gif图?科学制作动图的方法
- 宝尊电商拟转换为双重主要上市 二季度净利同比盈转亏
- 华为|3DUI人机交互+全场景智能语音,小鹏G9再一次领先?
- 中间件|CRIWARE为3D游戏推中间件TeleXus,支持空间音频、多人语音聊天
- 智能语音|人机交互的智障时代过去,没个智能语音功能都不好意思说是新车?
- 电源转换效率那点事,看完再纠结选啥“牌”
- pdf怎么转成xls?轻松转换方式教学
- mp4转换器如何转换QLV文件?轻松转换视频格式
- pptx怎么转换成pdf?轻松教你解决
- DuDuTalk:能录音能定位的与语音工牌,让销售&服务策略被准确执行