分层|最详细!深入浅出理解「3层6类」数据分层( 三 )
【 分层|最详细!深入浅出理解「3层6类」数据分层】下面是两个例子,分别适用于传统行业和互联网行业:
- 传统行业ODS层:各业务系统对接来的数据。拿交易源数据来说(每次订单的记录,一个订单有多个记录)。例如:交易源数据、用户源数据、货物源数据
- 互联网行业ODS层:除业务系统外,还会对接日志采集系统。拿app日志埋点来说,本层会记录用户每次登陆、app内的行为数据,一个用户会有多条记录)。例如:APP日志数据、小程序日志数据、用户登录数据等等
主要存档从ODS层汇总上来的数据,以业务过程作为建模驱动,基于每个具体的业务过程特点,构建最细粒度的明细事实表。可将某些重要属性字段做适当冗余,也即宽表化处理。从ODS层汇总上来的数据。最大限度保证与ODS层数据一致。
下面是两个例子,分别适用于传统行业和互联网行业:
- 传统行业DWD层:拿订单数据来说,本层会记录订单粒度的支付情况,一个订单仅有一条记录。例如:订单交易表、用户表、活动表、货物表。
- 互联网行业DWD层:拿用户登录表来说,本层记录用户在。
是对DWD层的生产数据进行轻度综合和汇总统计(可以把复杂的清洗,处理包含,如根据PV日志生成的会话数据)。轻度综合层与DWD的主要区别在于二者的应用领域不同,DWD的数据来源于生产型系统,并未满意一些不可预见的需求而进行沉淀;轻度综合层则面向分析型应用进行细粒度的统计和沉淀。例如:按照天粒度去汇总某一主题的数据情况。
- 传统行业DWM层:从DWD层交易表(天粒度)、用户表(天粒度)、货物表(天粒度)。
- 互联网行业DWM层:用户登录行为表(天粒度)、订单表(天粒度)。
文章插图
2. 四级数据分层在上述三层的基础之上,增加第四层DWS层。
1)第四层:DWS层
DWS=DWD+DWM
通过由轻度汇总层和明细层数据计算生成。又称数据集市或大宽表。按照业务划分,如流量、订单、用户等,生成字段比较多的宽表, 用于提供后续的业务查询,OLAP分析,数据分发等。
- 传统行业DWS层:用户主题宽表、货物主题宽表、店铺主题宽表。
- 互联网行业DWS层:用户主题宽表、店长主题宽表。
文章插图
3. 五级数据分层在上述四层的基础上,增加第五层ADS层。
1)第五层:ADS层
ADS层可以理解为对业务的“专属定制表”。ADS ≈ DWD+DWS,而且和DWD、DWS的表名侧重于object或用户行为不同的是,ADS的表名可以看出有特定的业务特征。
- 传统行业ADS层:爆款商品排行表、高价值用户表、用户近30天留存表。
- 互联网行业ADS层:业务大盘表、用户生命周期表、用户近7天留存表。
文章插图
本文由 @数据产品高远 原创发布于人人都是产品经理,未经许可,禁止转载
题图来自 Unsplash,基于CC0协议
- 京东|适合过年送长辈的数码好物,好用不贵+大牌保障,最后一个太实用
- 苹果|苹果最巅峰产品就是8,之后的产品,多少都有出现问题
- 红米手机|天玑1200手机将升级换代?红米真我两款机型降价,最低1599元
- 苹果|最具性价比的苹果手机来了,降价2120元,iPhone12已跌至冰点价
- 5G|关于5G,华为赢了
- 华为|华为任正非最新信件曝光:春天很快就会到来!
- 飞利浦·斯塔克|最便宜的小米 12 来了,2000 块左右
- 一嗨租车|倪光南最辉煌的时光是不是和柳传志的那段“蜜月期”?
- 微信聊天最令人头疼的场景是什么?一定有人会说是对方发来一连串语音还都是超过30秒的长消息...|终于!微信上线万众期待的新功能!网友:总算等到了
- 发现最小白矮星,其大小相当于月亮,这让科学家很兴奋