百度|用AI低成本制作自己的虚拟数字人?也行

百度|用AI低成本制作自己的虚拟数字人?也行

虽然虚拟数字人这个概念大家说东说西 , 众说纷纭 , 并没有一个统一的完整定义 , 不过大家都认可的基本共识是 , 通过人工智能等技术驱动数字虚拟人物 。 机智客举个例子比如我们可以驱动图像中或者制作的某个人物或形象合成一个新的视频 。 那么 , 基于这个基本认知 , 能否做一个简单点的低成本的虚拟数字人呢?当然 , 也行啊 。
低成本的概念 , 就是避免虚拟引擎等专业引擎再造独立的完整个人形象 , 只用基本的人工智能技术驱动一个图像中人物开口说话即可 。 这么一来 , 就显得简单多了吧 。 而这样的技术 , 不说现在 , 即便是之前一段时间 , 也已经出来了 , 只差整合了 。

简单说就是 , 自己拍一个或者制作一张带自己(人物)的图像 , 然后用AI实现驱动 , 让人物开口说话 。 这个AI也往往不是一种技术 , 图片中数字人要开口说话 , 就要先开口 。 这个可以用wav2lip这样的AI程序 。 接下来就是 , 既然说了话 , 那么这个“话”呢 , 也就是语音内容怎么解决 , 你自己录就行了——哈哈 , 当然机智客是开玩笑的 , 如果自己拍 , 那就不是虚拟数字人了 , 而是实拍真人说话了 。 这个语言内容 , 当然需要合成了 。 而这个 , 则需要另外一个AI程序 , 语音合成 。
这个技术 , 当属百度飞桨开源的了 。 PaddlePaddle开源出来的自己的Speech项目 , 可谓一记重拳 。 非常重磅 , 它可以让我们个人开发者调用他们训练好的模型做自己的语音合成和一些其他项目 。 在之前的文章里机智客已经说过了 , 就不多说了 。 而说到这个语音合成应用 , 这里暂时只有一个女声 。 如果用它 , 还无法切换其他语音 。
其实呢 , 关于低成本虚拟数字人这块 , 可能关注人工智能相关资讯的朋友也知道 , 百度就推出了一个开源项目 , 就是用了这样的技术实现了一个虚拟数字人的简单制作 。 这个实现过程其实和机智客上面介绍的差不多 , 以前自己做过一个人工智能版刘德华帮忙相亲的视频 , 就类似于这样的低成本虚拟数字人 。 话说回来 , 在PaddlePaddle上开源的这个项目主要的是 , 开源作者是将百度飞桨PaddlePaddle的各个独立项目应用的整合 , 做出了这样一个虚拟数字人 。
【百度|用AI低成本制作自己的虚拟数字人?也行】怎么样 , 看到今年(农历年)各个团队或大厂推出各自的虚拟人 , 有木有一点心痒痒的感觉 , 想不想做一个自己的虚拟人出来 。 如果预算有限 , 成本制约 , 可以用这个思路和相应AI技术来做一个自己的虚拟人出来 。