A轮融资|AliRTC 开启视频互动“零计算”时代( 二 )


第二个是几个比较大的供应商 , 包括在阿里云在内 , 外面这一圈 , 红色的线、蓝色的线 , 以及黄色的线 , 他们都处于相对比较一致的水平 , 但是没有一家有特别优秀的地方 , 所以技术同质化特别严重 , 大家基本上处于同样的水平 。

我们当前视频的实时互动主要集中在线上线下场景 , 未来可能会有更广阔的应用场景 , 比如说一些交互场景 , VR 操控类、虚拟现实类 。
这时候我们会思考一个问题 , 我们的技术是不是已经发展到了瓶颈期 , 我们无法满足未来更广泛的需求 , 这后面的原因是什么?会不会是我们的技术发展到某个瓶颈了?因为技术通常是阶跃式的发展 , 不能突破就会陷入在一个层次上 。
二、“零处理” 加速交互升级 我们希望分析一下 , 现在用户的体验到底怎么样?我们现在的技术存在什么问题?
通过比较各家 RTC 供应商 , 我们发现一个比较有意思的点 , 就是大家有千分之二的卡顿率是难以消除的 。 50%、60% 的丢包都可以做的很好 , 但是如果网络带宽受限 , 千分之二的卡顿就难以消除了 。

我们有一些手段可以解决类似的问题 , 比如利用窄带高清技术 , 我们可以通过复杂计算解决这些问题 , 也可以通过非标屏幕编码类技术解决 , 但是实际上我们很难把这些技术进行非常广泛的利用 。
最根本的原因是我们会发现端侧能力是有限制的 , 大家的手机各不相同 , 有可能有些人的手机特别好 , 可以做复杂算法 , 有些人手机差 , 无法进行复杂算法 , 同时 , 端的碎片化比较严重 , 要对所有端适配是比较困难的 。

在应用上我们希望能够提供更有趣的交互 , 比如说实时生成卡通人物形象 , 这在端上可以运行 , 但是只有少数非常强大的设备才能运行 。
一个自然的想法是 , 我们是不是能突破当前的应用架构?
我们把一个完全依赖端能力的架构 , 逐步转变成依靠云和端一起配合进行视频传输处理的架构 , 基于这个想法我们提出了云处理 + 端渲染技术 , 目的是希望从云上提供强大的处理能力 , 端上负责渲染 , 只需要提供很少的处理能力就能完成比较好的处理效果 , 使大家在不同的手机上都能得到一样的体验 。

这就是视频云“零处理” 解决方案的基本架构图 , 在端上只需要进行比较简单的视频采集以及视频传输 , 然后通过我们构建的覆盖全球的 GRTN 网络到达云端 , 云端使用 GRTP 的云端实时处理引擎对视频进行处理 , 再把处理好的视频传到端上 , 端上只需要做简单的呈现 。 这样可以很好的解决刚才提到端计算能力不够和碎片化的问题 。
但是天下没有免费的午餐 , 采用上面的架构 , 很容易发现几个问题 。
第一 , 我们的云上是不是能承受这么大规模的处理 。
第二 , 云上能不能承担这么大规模的成本 。
第三 , 云上能不能持续提供这么多类型的处理服务 。
我们自己的信心来自于几个方面 。
第一 , 通过阿里多年的积累 , 我们积累了业界最大规模的云上视频处理集群 , 所以我们在技术上已经具备承担超大规模处理的能力 。

第二 , 关于成本 。
下图是我们处理的一张业务图的示例图 , 横坐标是时间 , 纵坐标是资源使用量 , 黑色的线一种业务 , 红色线是另一种业务 , 可以看到 , 每种业务都存在大量的业务空闲期 , 业务空闲期可以让我们有大量资源供我们复用 , 当我们把多种业务混跑时 , 就能把资源利用起来 , 大幅度降低成本 。