宽表定义及使用

兴哥,咨询两个问题 1.你认为数仓中什么样的表算的上宽表,你对宽表的定义是什么? 2.宽表是怎么设计能让下游易用?

问题1宽表定义: 宽表核心在于可复用、一次性解决查询的难题,宽表分三种dwm明细宽表,dws指标宽表,ads标签宽表 Dwm 明细宽表在于一次性解决查询问题,适用于场景包括业务方取数查询,数仓侧报表等展示,明细宽表将多个dwd 组合而成,并下沉维度,保障了后续查询时只需要查询这一张表即可(摆脱了每次查询都要关联维度表和其他dwd表),同时计算指标时也可以进行依赖。 Dws指标宽表在于复用,例如开发好交易场景的用户颗粒度的指标表,后续你每次开发指标时候都可以直接left join使用,保障了指标口径在dws统一的同时还可以减少后面逻辑重复计算消耗。 Ads标签宽表在于以维度表为主表left join其他数据表,可以将用户/商品等标签属性都可以从维度表出,同时维表的数据绝对唯一,最重要的是可以基于维度和指标去加工指标,例如我们之前讲的sau(发布次数大于3次 点赞大于x次等),加工好的标签可以开发报表,也可以用ab实验,也可以做用户画像,提升了复用。

问题2 宽表设计好用 明细宽表:需要考虑增全量存放,如果涉及多业务场景需要考虑2级分区建设,同时需要以一张核心业务表为主表关联其他表,并将业务常用维度放入表中(可按照业务诉求慢慢加) 指标宽表:先考虑数据域,考虑周期(最近1天最近7天,甚至你可以都做成最近一天的),考虑粒度,这里做dws就不用group by维度了,只group by粒度方便后续使用,同时dws只做派生指标,不要做复合指标 标签宽表:以维度表为主表left join dws,Dwm的子查询等建设标签表,可以按照分析视角去建设 例如消费能力 用户体验等来拆分标签表,后续所有ads表都依赖标签表

#数据开发工程师##数据分析##数据人offer决赛圈怎么选##实习如何「偷」产出?##牛客创作赏金赛#
全部评论

相关推荐

我要娶个什么名:学长你电脑闹鬼了
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务