洛天依|用一篇文章,帮你了解什么是虚拟数字人?

编辑导读:洛天依的出现和爆火,让很多人看到了虚拟偶像的广阔市场。不仅如此,虚拟主播、虚拟员工等数字人不断涌现,在代替人类从事某些行业的同时也引发了一些争议。本文作者围绕“数字人”进行分析,希望对你有帮助。
洛天依|用一篇文章,帮你了解什么是虚拟数字人?
文章插图
大家好,我是Clippp。今天为大家分享的是「虚拟数字人」。这段时间元宇宙概念的大火带动了很多人对未来的无限遐想,与元宇宙紧密相关的虚拟数字人的热度也在提升。
现在网络上经常出现各式各样的数字人,虚拟偶像、虚拟主播层出不穷,当然伴随着数字人一同出现的还有各种争议。
今天我们就来一起探究虚拟数字人是什么、具有哪些特征,分为哪几种类型以及都应用在什么行业,深入地了解虚拟数字人概念。
一、数字人的三方面特征虚拟数字人是指具有数字化外形的虚拟人物。与具备实体的机器人不同,虚拟数字人依赖显示设备存在,我们所知的很多虚拟人都要通过手机、电脑或者智慧大屏等设备才能显示。
洛天依|用一篇文章,帮你了解什么是虚拟数字人?
文章插图
虚拟数字人宜具备以下三方面特征:

  • 一是拥有人的外观,具有特定的相貌、性别和性格等人物特征;
  • 二是拥有人的行为,具有用语言、面部表情和肢体动作表达的能力;
  • 三是拥有人的思想,具有识别外界环境、并能与人交流互动的能力。
综合来看,就是具备四方面的能力,即形象能力、感知能力、表达能力和娱乐互动能力。
如果我们下次再看到有公司推出数字人,就可以结合这些特征和能力来判断这个数字人的可信度,避免被借势营销的企业钻了空子。
二、数字人的运作原理知道了什么是数字人,接下来就要搞清楚数字人到底是怎么说话、互动的,是背后有真人在操控,还是完全通过技术生成。
面对新兴的数字人,相信很多读者都存在类似的疑问。
数字人的诞生发展和AI人工智能可以说是密不可分,想了解数字人的运作原理,首先要知道数字人的通用系统框架。
虚拟数字人系统一般情况下由人物形象、语音生成、动画生成、音视频合成显示、交互等5个模块构成。(资料参考:2020年虚拟数字人发展白皮书)
洛天依|用一篇文章,帮你了解什么是虚拟数字人?
文章插图
交互模块为扩展项,根据其有无,可将数字人分为交互型数字人和非交互型数字人。
首先看一下非交互型数字人:系统依据目标文本生成对应的人物语音及动画,并合成音视频呈现给用户。
洛天依|用一篇文章,帮你了解什么是虚拟数字人?
文章插图
交互型数字人根据驱动方式的不同可分为智能驱动型和真人驱动型。
洛天依|用一篇文章,帮你了解什么是虚拟数字人?
文章插图
智能驱动型数字人:通过智能系统自动读取并解析识别外界输入信息,根据解析结果决策数字人后续的输出文本,驱动人物模型生成相应的语音与动作来使数字人跟用户互动。
这种人物模型是预先通过AI技术训练得到,可通过文本驱动生成语音和对应动画,业内将此模型称为TTSA(Text To Speech & Animation)人物模型。
洛天依|用一篇文章,帮你了解什么是虚拟数字人?
文章插图
真人驱动型数字人:真人根据视频监控系统传来的用户视频,与用户实时语音,同时通过动作捕捉采集系统将真人的表情、动作呈现在虚拟数字人形象上,从而与用户进行交互。
三、数字人常见的类型调研分析当前市场上的数字人,根据人物图形维度,分为2D和3D两大类,从外形上可分为卡通、写实等风格,综合来看可分为二次元、3D卡通、3D高写实、真人形象四种类型。