数据|字节造火山,又一个数据中台的故事

数据|字节造火山,又一个数据中台的故事
文章插图

雷锋网按:外界总会首先注意到字节跳动不少产品是建立在推荐引擎上的,但也往往会忽略与推荐引擎相辅相成的还有数据中台。从简单的A/B测试,到后来的数据分析平台、数据开发治理、ABI、极速OLAP引擎等一系列产品形态的拓展,逐渐形成了数据中台如今的模样。而这项工作的主要承担方,其实正是最近一段时间字节跳动开放出来的火山引擎数据中台。
字节跳动的早期其实并没有很成熟的数据处理体系(比如数仓),更别说有数据中台这类体系了。但就在短短几年间,伴随今日头条、抖音、西瓜视频等多款爆款应用的成长,字节跳动的数据架构、实践路径、产品体系也逐步打磨出来。
在字节内部,数据中台受到业务线的格外重视,一旦有新的产品业务上线,都会找到数据中台请求支撑。正是这种休戚与共、强调解决问题的务实精神,让数据中台对内已经能够支撑集团数百条业务。而最近一年,越来越多的外部客户、圈内厂商也跑来咨询:“诶?你们的数据中台BP团队、增长引擎,究竟是怎么搞的呀?”
在数据中台团队看来,现在有很多客户对字节跳动内部数据驱动的理念和实践是非常感兴趣的。只是当前阶段,数据中台需要进一步加快最佳实践的产品化,满足客户的差异化诉求。
那么,何为中台BP?何为数据驱动增长?何为“以应用为中心”的数据中台?雷锋网近期与火山引擎数据中台负责人罗旋进行了一次深入交流,以还原当下火山引擎数据中台的独到之处。
抖音的早期故事
2020年9月,来自一份第三方的调研数据显示,抖音用户日均总使用时长是441.6亿分钟。换算成你能理解的时间跨度,意味着将近9万年。抖音获得用户青睐的同时,也在悄悄地改变着互联网流量战争的格局。
【 数据|字节造火山,又一个数据中台的故事】实际上,因其强大的Feed流和推荐算法,抖音平台的早期用户自然增长率非常高,无论是用户黏性、活跃量,还是停留时长,这意味着抖音早期几乎不需要什么大力投放,因为本身它就是一款产品力非常强的应用。
时局到了第二阶段,就不太一样了。大概是在2018年初,抖音平台上已经积累了大量活跃用户,为了进一步优化体验,给用户带来价值,产品也同时进入到了功能版本迭代的高发期。这时,就会遇到一个命题——A/B测试固然有效,但如何保证每一次迭代的决策长期来看是正确的?此时,产品经理就需要依靠大量的数据对产品的各种情况进行测算。
再往后,抖音的用户体量已经足够大,且进入到增长曲线的平滑期,除了精细化运营外,更需要探索新的增长空间。产品如何快速试错、大量尝试?此时,无论是底层引擎的响应速度,还是贴近应用层的工具服务,都需要跟上抖音的业务节奏。
分析以上过往你会发现,抖音从早期发展到如今的成功,离不开数据驱动理念的支撑,而给这一理念披上产品外衣的,用今天的视角来看其实就是火山引擎的数据中台。
火山数据中台的前世今生
在字节跳动内部,有这么一句话:“A/B是一种信仰,风神(数据洞察平台)是一种习惯。”

  • 2014年前:
可以说,A/B测试从2012年字节跳动创建之初就已经开始应用,通过A/B测试来消除偏见,接近客观事实。
  • 2014~2018年:
随着A/B测试越做越多,字节团队发现非A即B的负面影响,只看一个结果是不够的,需要进一步对数据进行分析以佐证判断,为此在A/B测试的基础上开发了数据洞察平台风神。而像数据集成、数据开发、数据治理等更多的工具也逐渐在这段时间里成型。