分层|最详细!深入浅出理解「3层6类」数据分层( 三 )


【 分层|最详细!深入浅出理解「3层6类」数据分层】下面是两个例子,分别适用于传统行业和互联网行业:

  • 传统行业ODS层:各业务系统对接来的数据。拿交易源数据来说(每次订单的记录,一个订单有多个记录)。例如:交易源数据、用户源数据、货物源数据
  • 互联网行业ODS层:除业务系统外,还会对接日志采集系统。拿app日志埋点来说,本层会记录用户每次登陆、app内的行为数据,一个用户会有多条记录)。例如:APP日志数据、小程序日志数据、用户登录数据等等
2)第二层:DWD层
主要存档从ODS层汇总上来的数据,以业务过程作为建模驱动,基于每个具体的业务过程特点,构建最细粒度的明细事实表。可将某些重要属性字段做适当冗余,也即宽表化处理。从ODS层汇总上来的数据。最大限度保证与ODS层数据一致。
下面是两个例子,分别适用于传统行业和互联网行业:
  • 传统行业DWD层:拿订单数据来说,本层会记录订单粒度的支付情况,一个订单仅有一条记录。例如:订单交易表、用户表、活动表、货物表。
  • 互联网行业DWD层:拿用户登录表来说,本层记录用户在。
3)第三层:DWM层
是对DWD层的生产数据进行轻度综合和汇总统计(可以把复杂的清洗,处理包含,如根据PV日志生成的会话数据)。轻度综合层与DWD的主要区别在于二者的应用领域不同,DWD的数据来源于生产型系统,并未满意一些不可预见的需求而进行沉淀;轻度综合层则面向分析型应用进行细粒度的统计和沉淀。例如:按照天粒度去汇总某一主题的数据情况。
  • 传统行业DWM层:从DWD层交易表(天粒度)、用户表(天粒度)、货物表(天粒度)。
  • 互联网行业DWM层:用户登录行为表(天粒度)、订单表(天粒度)。
分层|最详细!深入浅出理解「3层6类」数据分层
文章插图
2. 四级数据分层在上述三层的基础之上,增加第四层DWS层。
1)第四层:DWS层
DWS=DWD+DWM
通过由轻度汇总层和明细层数据计算生成。又称数据集市或大宽表。按照业务划分,如流量、订单、用户等,生成字段比较多的宽表, 用于提供后续的业务查询,OLAP分析,数据分发等。
  • 传统行业DWS层:用户主题宽表、货物主题宽表、店铺主题宽表。
  • 互联网行业DWS层:用户主题宽表、店长主题宽表。
分层|最详细!深入浅出理解「3层6类」数据分层
文章插图
3. 五级数据分层在上述四层的基础上,增加第五层ADS层。
1)第五层:ADS层
ADS层可以理解为对业务的“专属定制表”。ADS ≈ DWD+DWS,而且和DWD、DWS的表名侧重于object或用户行为不同的是,ADS的表名可以看出有特定的业务特征。
  • 传统行业ADS层:爆款商品排行表、高价值用户表、用户近30天留存表。
  • 互联网行业ADS层:业务大盘表、用户生命周期表、用户近7天留存表。
分层|最详细!深入浅出理解「3层6类」数据分层
文章插图
本文由 @数据产品高远 原创发布于人人都是产品经理,未经许可,禁止转载
题图来自 Unsplash,基于CC0协议