音乐|未来媒体访谈全新改版|王仲远:随着AI模型越来越大,创作想象空间越来越广( 二 )


主持人:
您刚才聊到了 AI歌手和AI音乐,我们非常的感兴趣,所以说像我们作为人工智能的一个分支,我们都知道智能语音正在被用到越来越广的越来越多的领域,AI歌手更是一个多学科交叉的体现,我们想了解一下从2019年到现在,AI歌手经历了怎样一个迭代的过程?
王仲远:
在AI歌手过去这两年的研发当中,我们其实也经历了两个大的阶段,从一个传统的一种我们把它称之为word模型,它是一个基于信号处理的,将这样的一个文字变成一个演唱出来的这样的一种形式。到现在我们基本上都已经基于了深度学习的网络模型,所以我们有了我们的网络的声码器,那么它能够基于我们的大数据,通过这样的一个反复的学习,使得AI的模型能够模仿出歌手的演唱。
主持人:
AI歌手出现正在挑战着真人歌手的地位,带来一个不一样的科技感,我们就会好奇说,在未来或者是目前为止,这个技术角度,AI歌手有没有可能顶替真人歌手?
王仲远:
每一次技术的变革,其实我们更期待的是如何去拥抱技术,使得技术与人和谐相处。当前其实我们的AI歌手的演唱水平,经过过去两年的技术迭代,在我看来已经基本接近一个普通歌手的水平,但是它依然有很多的问题。比如说真人的歌手他在演唱的时候会有他的情感,会有他的演唱的技巧,以及他在不同的场合的一些临场发挥。但是在我们目前的AI歌手的这种模型,依然是在追求使得他唱得准,使得他能够把整首歌曲给演唱下来,所以其实我在我看来,他跟人还是有很多本质的区别,并不期待AI歌手能够非常快速的对我们真实的歌手有一种顶替的作用。但是它其实会是一个帮助我们的用户有更加趣味性的能够去互动,能够去欣赏,以及使用自己的音色去演唱出属于自己的歌曲,这样的一个有趣的一种互动的形式。
主持人:
您刚才描述的基本都是 Ai歌手的短板之处,它的优势是什么呢?
王仲远:
它的优势是他总能唱的那么好听
主持人:
总能唱的那么好听?只就只有这一个优势吗?
王仲远:
这是应该它最大的一个优势,我们的AI歌手还是能够通过大量的数据的学习,使得他的演唱水平是远超普通用户的。同时我们也正在研发能够把自己的音色融进去,我们期待有一天我们的用户也许只需要把歌词读出来,然后他就能够听到用自己的音色唱出来的歌曲了。
主持人:
我们都知道这个真人歌手录制一首,成品歌曲需要消耗很多的精力和时间,AI歌手可能几分钟就录制完一首歌了,而现在 AI技术的发展可能已经基本可以做到让普通人的人耳可以听不出 AI的歌手和真人歌手的唱歌的一个区别。那么是不是可以这么理解,就是真人歌手的一个生存空间正在被 AI歌手所倾轧呢?
王仲远:
其实计算机的一个优势就是它算得特别快,它通过这样一个海量数据的学习,使得他去探索整体的这种艺术的空间的速度也是非常快的,所以您可以想象我们的一首音乐确实对于音乐的制作人,快则可能几天,慢则可能一两个月才能创作出一首音乐,然后我们的歌手可能要花几天的时间才能够去录制一首歌曲,但是所有这些对于AI的模型来说,它只需要几分钟,乃至几十秒的时间就能够完成。
主持人:
作为AI音乐的爱好者,我们想知道传统音乐的制作流程是我们先作词作曲,然后是编曲,最后进行一个录音和混音,那么在AI技术的帮助下,AI的作词和AI的旋律的创作跟传统的模式有什么不同?
王仲远:
其实从流程上来看,没有什么特别大的不同,更多的是在每一个环节,我们的AI的模型都能够帮助人们去探索新的可能性,而且是非常的便捷和快速,它其实是通过海量数据的学习,使得他知道把什么样的音符组合起来,是一个人们比较喜欢的这样的一种旋律。