从喜马拉雅看音频技术革命的下一站( 二 )


文章图片
目前 , 喜马拉雅上已有80多部运用还原自单田芳先生声音的AI合成音制作的专辑 , 这些专辑在喜马拉雅也一直深受用户喜爱 , 多张评书专辑长期位列喜马相声评书热播榜前列 , 例如《卧虎藏龙》《蜀山剑侠传》等 。
不仅如此 , 喜马拉雅被ICASSP2022收录的自研跨语言语音合成技术 , 甚至在未来可以让我们听到单田芳先生的“声音”来播讲英文内容 。 也许在不久的将来 , “单田芳英文声音重现”将与此前官方授权的“单田芳评书”和“单田芳声音重现”共同构成全新的“单田芳IP”矩阵 。
AIGC正在成为人类PGC的延伸 , 以立体、真实的方式突破助力PGC突破空间、时间的局限 , 使PGC内容体系化得到了一次质变的提升发展 。
以AIGC创造PUGC , “AI续写+AI主播”闭环生产展现广阔前景
随着技术的发展 , AI不仅是一种技术载体 , 也逐渐成为了一种人格象征 。 喜马拉雅基于自研的TTS框架 , 并采集头部主播“喜道公子”的真声打造了AI主播“喜小道” , 而基于大规模语言模型自研的自然语言处理模型的续写应用“彩云小梦”已经可以实现小说故事的AI创作 , 只需要给她一个1-1000字的开头 , 它就能为你续写出后面的故事 。
借助自己AI智能技术有声化的优势 , 喜马拉雅的AI主播“喜小道”与彩云小梦续写AI合作 , 打造了首个从故事创作到演播均由AI完成的AI电台 。 据了解 , 彩云小梦入驻为喜马拉雅旗下网文创作平台奇迹文学的写手 , 将其作品经AI主播“喜小道”有声化后 , 发布在喜马拉雅平台 。
“AI续写+AI主播”的方式证明了AIGC已经拥有了自己形成完整生产闭环的能力 , 更诞生了一种全新的以“AIGC”功能为基础的“PUGC” , 展现了AIGC及AI技术赋能创作广阔前景 。
当AIGC遇上UGC , 想象力与算力碰撞后的指数增长
目前 , AIGC由于技术成本和规格限制 , 更多集中在对于PGC和PUGC的加持上 , 未来如果AIGC成为每个UGC手中的工具时 , AIGC强大的算力思维和UGC的蓬勃的内容创作活力将在提升创作效率的同时 , 进一步丰富内容的多样性 。
相关行业专家表示 , 在无监督学习、深度强化学习、迁移学习、生成对抗网络等算法深入研究的基础上 , AI的算力将越发强大 , 其背后自运算与强适应的特征能够完美匹配每一个内容生产者 , 指数级释放UGC内容创作的活力 , 带来多样且生动的内容创作光谱 , 有着非常大的想象空间 。
当每一个人都拥有一个可以帮你定制化解决问题的“大白” , 每一个内容创作者都将可以拥有一座自己的“喜马拉雅” 。
技术势能释放商业价值新想象
对于消费者来说 , AIGC是对于内容的加持是一次成功的探索 。 艾媒咨询《2021年中国耳朵经济发展专题研究报告》显示 , 超过六成受访用户认为AI合成音频比普通音频节目更有趣 , 55.4%和48.5%的用户认为合成技术能增加内容丰富度和提高现有的音频节目质量 。
在AIGC对于内容如此强大的增益背后 , 对于国内音频产业而言 , 技术越来越成为行业的重要竞争维度 。 易观报告显示 , 2021年 , 以喜马拉雅为代表的主流平台不断投入技术研发 , 通过提升工业化水平 , 助力创作者实现更优质的内容表达 。 喜马拉雅等头部音频平台凭借自身的技术、团队、资金等优势深耕有声书、有声剧等赛道 , 丰富内容样态 。
从喜马拉雅看音频技术革命的下一站】商业规模带动技术创新 , 技术创新反哺市场选择 , 形成了一种喜马拉雅商业规模和技术发展双驱动之下的良性网络 。 据了解 , 喜马拉雅已在AI语音技术领域潜心钻研多年 , 并在内部专门成立了喜马拉雅智能语音实验室这一核心部门 , 长期专注于语音合成、识别、语音信号处理、编解码以及智能音效的研究和开发 。 喜马拉雅智能语音实验室卢恒表示 , 未来 , 喜马拉雅将持续投入语音技术的研发升级 , 不断创新和突破 , 进一步打开对于声音的理解和想象 , 让技术加持声音、让声音服务生活 。