淘宝|从 6 个方面,深入分析淘宝智能直播间的产品设计( 二 )





淘宝智能直播间产品分析对于目前淘宝智能直播间的表现 , 我们可以从虚拟内容生成、虚拟内容展示、直播互动几个角度进行解读分析 。
1. 虚拟内容生成对于传统电商直播 , 文本凝聚着商品的核心信息 , 真人主播将商品信息吸收转化再通过直播间传达 。 而智能直播所提供的虚拟内容 , 同样离不开虚拟主播和文本内容这两个重要部分 。
在淘宝智能直播间 , 商品介绍文本是通过抓取商品详情页的图文信息智能生成的 , 无需用户手动输入(当然这些文本支持用户更改) , 这对于不善直播运营撰写介绍文本的中小商家是非常友好的 。 将生成的介绍文本进一步转化成语音并驱动虚拟主播的表情和动作 , 如此一个活灵活现可以介绍商品的虚拟主播便生成了 。
形象方面:虚拟主播模型支持自由配置换装 , 卡通的形象风格与淘宝人生一致 , 不知在技术方面是否完成了打通 。
语音方面:与一般平缓的人工智能语音不同 , 这些虚拟主播参考了真人主播的发音和语气 , 情绪更为饱满更适用于直播带货场景 。 而且支持声音定制 , 商家只需要提供半小时的录音 , TTS 技术不仅能用主播的声音播报 , 还能用主播的声音说外语 。
文本解析与表现方面:虚拟主播的语音、表情、动作极力模拟真人主播 , 并紧扣文本内容突出重点地表达 。 比如强调产品卖点和催买时 , 虚拟主播的表情、音量、动作都会放大来强化信息传达 。
2. 虚拟内容展示有了主播有了要介绍的内容 , 如何进行有效的传达是智能直播面对的一大难题 。 因为真人主播有着更强的表现力 , 商品也可以实操演示 , 让观众所见即所得 。 虚拟主播再拟人也很难达到真人主播的表现力 , 无人辅助的情况下演示真实商品那更是不可能实现 。 那虚拟内容在展示上有哪些优势又怎样规避劣势呢?我们可以分成虚拟场景和信息传达两部分来看 。
虚拟场景方面:直播间会使用一个有三维空间感的虚拟背景 , 大多为室内场景 。 且跟随讲解背景会有变化 , 一种变化是随着虚拟主播的讲解会有一个横向的运镜变化 , 展示全景的虚拟空间;另一种是现在看到的比较多的 , 讲解商品时背景显示蓝幕 , 蓝幕上展示商品图片 , 讲解完商品后切换回虚拟室内场景 。 场景化的虚拟背景更有空间感 , 不受真实场景约束有更大的想象空间;同时加入场景变化使得画面更丰富 , 降低了用户长时间观看的沉闷感 。
信息传达方面:淘宝智能直播间目前主要借助了三类载体进行传达商品相关信息 , 弥补无法实操演示的短板:
商品卡片:早期版本画面右侧的商品卡片会动态展示商品相关图片/视频 , 商品名称和价格也会一并显示 , 用户可以直接点击这个链接进入详情页;目前版本则多采用蓝幕背景 , 在画面中上位置展示商品相关图片/视频 , 商品名称和价格会根据图片/视频素材的比例进行动态布局 。 这其实是将原先的视频卡片拆分掉 , 将图文部分拎出来 , 放在用户视觉中心区着重展示 。 剩下的链接跳转功能 , 只突出“价格”信息和“下单点我”的引导信息 , 减小卡片面积放到画面左侧位置 。 整体来看 , 虽然无法实际演示产品 , 但是图片/视频信息动态展示也能起到一定作用 , 并且名称、价格甚至原价等核心信息很齐全 , 此外商品卡片链接也具有较强的引导性 , 缩短了用户的购买路径 。
文字字幕:在虚拟主播旁边会有一个文字字幕显示出来 , 内容就是显示虚拟主播当前播报的文字内容 。 主播已经在说话了为什么还要支持字幕呢?在笔者看来多一路信息传播渠道 , 方便信息更好的接收 , 既听得到也看得到 , 这是正常直播无法做到的 , 有效支持了不方便开语音的直播观看环境 。