英伟达|NVIDIA以人工智能打造拟人化语音应用,让机器人可以更富「情感」

英伟达|NVIDIA以人工智能打造拟人化语音应用,让机器人可以更富「情感」

文章图片

英伟达|NVIDIA以人工智能打造拟人化语音应用,让机器人可以更富「情感」

文章图片

英伟达|NVIDIA以人工智能打造拟人化语音应用,让机器人可以更富「情感」

NVIDIA以人工智能打造拟人化语音应用 , 让机器人可以更富「情感」 , 让未来人机互动可以更加自然
【英伟达|NVIDIA以人工智能打造拟人化语音应用,让机器人可以更富「情感」】在NVIDIA旗下针对人工智能技术应用研究项目中 , 语音项目已经成为相当重要研究内容 , 其中包含针对在线视频互动时的声音识别优化、拟人化的聊天机器人等应用 , 而NVIDIA的目标更希望创造更富「情感」的人机互动体验 。

NVIDIA深度学习应用研究部门副总裁Bryan Catanzaro表示 , 「声音」在许多时候成为沟通重要关键 , 尤其在人与人之间沟通会通过声音起伏变化判断对方说话时的情绪 , 进而产生不同互动感受 。
目前在NVIDIA针对声音项目的研究中 , 不仅通过人工智能分析语句、语意等内容 , 同时也会借助音调起伏等变化 , 借此记录各类说话时产生情绪 , 使得人工合成声音可以变得更有「感情」 , 进而能够呈现更「真实」的电脑语音 , 并且让机器人、数字助理服务在声音互动更有亲和力 。
Bryan Catanzaro说明 , 一般人在与机器人等科技产物互动时 , 若接收到的是较为冰冷的电子合成语音 , 势必会让互动体验大幅降低 , 但如果能通过更贴近自然人声说话模式呈现 , 则会吸引更多互动意愿 , 原因在于更贴近自然人声的互动模式较容易让用户放下「戒心」 。
例如近年用于展示人工智能技术应用的「I am AI」短片中所呈现口白 , 实际上就是通过NVIDIA旗下人工智能技术合成的电子语音 , 其中不仅参考自然人声发音 , 更通过后续调整让整体口说内容更像真人表达 , 借此诠释NVIDIA在人工智能技术投入应用方向 , 亦即让人工智能可以协助人类完成更多挑战 。

而为了让人工智能技术合成的电子语音更像真人 , NVIDIA目前也与诸如Mozilla Common Voice等第三方语音数据内容提供商合作 , 通过更庞大语音数据量进行训练 , 让人工智能可以呈现各地区语言、不同口音呈现方式 , 其中包含美国英语、英国英语或澳洲英语发音上的差异 , 或是同样都是中文 , 在国内、中国、新加坡、香港等地区也会有不同发音表现 , 借助人工智能进行深度学习 , 都能让系统呈现不同发音 。
在NVIDIA的目标中 , 自然是希望消除机器人等设备通过语音与人互动时的隔阂感 , 甚至让人工智能驱动互动服务能以更贴近真人发音增进互动真实感 , 或是搭配肢体语言更加活灵活现 。
至于在应用部分 , NVIDIA更强调可通过SDK、API等资源让开发者更容易连接使用 , 进而创造更丰富的拟真互动系统 , 同时也能让更多应用服务通过拟人化方式吸引更多人使用 。



科技改变世界 , 知识改变命运!欢迎点赞、关注“新千万个为什么” , 第一时间了解电脑、手机、相机、数码、3C等科技信息!