百度|十年增长700亿,数字人赛道如何转动增长飞轮?( 二 )


市场够大、技术也在提高,产业上下游纷纷从自己擅长的角度切入市场。
第一类跳进来的是内容公司,比如游戏公司Epic Games为写实虚拟人制作了MetaHuman Creator工具;燃麦科技推出超写实数字人AYAYI;创壹视频推出虚拟人物柳夜熙。
只是内容公司虽然在形象设计上有较强能力,但这些能力可替代性强,而数字人需要同时具备语音技术、视觉技术、自然语言处理等技术能力,才能呈现接近真人的互动效果。
因此我们看到,手握技术的公司纷纷布局数字人市场。
其中一种是AI技术公司。比如今年10月科大讯飞推出了虚拟人交互平台;商汤在年初也已经开始宣传数字人产品落地金融领域。
另一种是同时掌握技术和场景的大厂。
4月,随着中国首次火星探测任务的执行,百度联合航天发布全球首个火星车数字人“祝融号”,该数字人将被应用于知识科普、虚拟主持等多个场景来传递航天知识;
9月,华为发布了首个数字人“云笙”,参与到为华为云内部员工提供技术内容宣讲、答疑解惑等工作。并随后又推出了一款数字人开放平台;
10月,OPPO推出了小布虚拟人和小布虚拟人定制平台;
11月4日,腾讯发布了5款数智人产品,拥有文旅导览、金融客服、多语种主播、手语主播等不同职业身份和技能,可提供定制化角色服务;
11月29日,百度代言人龚俊的虚拟数字人“俊俊”正式在百度APP上线,可以在APP内实现与用户的互动;
12月2日,网易云音乐上市现场,29岁的数字人“丁磊”和真实的丁磊,通过网易伏羲开发的沉浸式活动系统“瑶台”共同敲锣。
虽然同是掌握技术的公司,与大厂相比,AI技术公司缺乏C端入口和客户渠道的劣势依旧明显。大厂拥有更多的资源和资金,采取的打法一般是一边推出基于自身优势场景的数字人来打造应用标杆,一边推出数字人平台将产品继续落地到更细化的场景中,点、线互相推进。
面对众多玩家纷纷布局的现状,百度李士岩也向钛媒体APP阐述了选择平台化打法的思考:当下国内数字人发展存在着产业链效率较低、上下游生态未完全打通、缺乏标准化体系、缺乏平台等痛点,这也造成应用门槛居高不下。
百度智能云曦灵以平台为切入口,一方面通过平台化的方式让越来越多的数字人进入平台来均摊前期的投入成本;另一方面基于平台打造完整的生态链服务,助力破解行业痛点,将数字人的高门槛、高投入真正降下来。
四大AI引擎、三大平台目前基于曦灵平台的数字人已经在民生银行、交通银行,中国联通、央视网、中国航天局等多场景落地。在众多竞争者中,各家为什么会选择曦灵平台?
在回答这个问题之前,我们要先弄清楚什么才是数字人的本质?从最开始通过音频合成软件生成数字人到利用中之人驱动数字人再到现在的AI驱动,纵观数字人的发展路径不难发现:数字人的每一次迭代,本质上都是技术驱动的。
因此,更多落地场景和更逼真形象的背后是对技术更高的要求:
首先,在交互维度上,要保证数字人在真实环境下能听能说能交互。
这也就揭开了曦灵的第一层优势:四大AI引擎。通过人像驱动引擎、自然对话引擎、语音交互引擎、智能推荐引擎实现数字人能听能说能理解能互动。
能听能说。目前百度语音识别ASR(Automatic Speech Recognition)的准确性能够达到98%以上,语音合成TTS(Text To Speech)方面既支持用20句话定义一个新的声音,还支持用更多的数据来进行更精细化的训练,这样既可以轻量化的满足需求,又能保证声音还原度。李士岩透露,今年百度还最新研发了人工智能变声器,可以将一个人的声音音色特征保留下来,这样就可以发挥更多“人”的创造性。