题解 | #2021年11月每天新用户的次日留存率#

2021年11月每天新用户的次日留存率

https://www.nowcoder.com/practice/1fc0e75f07434ef5ba4f1fb2aa83a450

留存率的计算可以说是数据分析师, 或者数据开发必备的技能了, 很多公司都会用到这个指标, 该题还有进阶版的: 计算次日至7日内的新增用户留存率

  1. 思路: 根据uid分组, 取min(in_time)最小值, 得到用户的首次登录日期, 作为衍生表t1
     select ul.uid,
         min(date(ul.in_time)) min_date
     from tb_user_log ul
     group by ul.uid
  2. 因为题目要求, out_time跨天也算该日活跃, 那么第二个子查询, 只需要关键字, uid, in_time, out_time即可, 这里其实可以直接用衍生表t1的uid左连接tb_user_log, 这样能得到如下的格式数据(假设, id为1的用户, 在1-3号都有登录过, 则会出现3条数据
    t1.uid t1.min_date ul.uid ul.in_time ul.out_time
    1 2022-11-01 1 2022-11-01 2022-11-01
    1 2022-11-01 1 2022-11-02 2022-11-02
    1 2022-11-01 1 2022-11-03 2022-11-03
  3. 如上表, 可以再根据, t1.min_date 进行分组, 对 t1.uid 进行去重, 则可得到该日的新增用户数, 而下一
    天的用户数, 则可使用case when 对ul.in_time 和 out_time 进行判断, 这里我用的是
    count(distinct case when t2.l_in_time = date_add(t1.min_date, interval 1 day)
        or t2.l_out_time = date_add(t1.min_date, interval 1 day) then t2.uid
        else null end)
    同理, 3-7日的留存率也可如此计算.

    优化点: 一个用户在一天可以登录多次图片说明

    这样直接左关连tb_user_log(此表生产环境中一般都极大), 所以可以根据uid, date(ul.in_time), date(ul.out_time) 来缩小连表的数据量, 一个用户一天只需要保留一条数据即可

select t1.min_date as dt,
    round(count(distinct case when t2.l_in_time = date_add(t1.min_date, interval 1 day)
          or t2.l_out_time = date_add(t1.min_date, interval 1 day) then t2.uid
          else null end)/count(distinct t1.uid), 2) as uv_left_rate
from (
    select ul.uid,
        min(date(ul.in_time)) min_date
    from tb_user_log ul
    group by ul.uid
) t1 left join (
    select ul.uid,
        date(ul.in_time) l_in_time,
        date(ul.out_time) l_out_time
    from tb_user_log ul
) t2 on t1.uid = t2.uid
where min_date between '2021-11-01' and '2021-12-01'
group by min_date
order by min_date
#数据分析师#
全部评论
count(distinct case when t2.l_in_time = date_add(t1.min_date, interval 1 day) or t2.l_out_time = date_add(t1.min_date, interval 1 day) then t2.uid else null end) 想问问这里为啥对t1,t2都用distinct去重了呀?是因为一个用户可以一天登录多次吗?
点赞 回复 分享
发布于 2023-02-17 19:08 湖北

相关推荐

脑袋锈住了:你这算啥,哥们中科院中强所硕士,本科211,叫我去干分拣,时薪20
点赞 评论 收藏
分享
02-12 20:22
重庆大学 Java
字节暑期刚入职四天,因为是年前,所以很多正职都放假走了,也就没有给我分配mt,然后有一个老哥在我来的时候给我发了一个landing手册,然后还有关于部门业务的白皮书,还有一些业务代码。然后本人是java面的,进来第一次接触go语言 前面几天熟悉了一下go的语法和go的框架,可以读但是还不太会写,然后业务白皮书也看的很头疼,包括landing手册里要了解的很多东西说实话我看文档真的快看死了,一个嵌套一个,问题是我还完全不知道咋用这个我了解的东西,还有就是那个项目代码,那个老哥喊我去写写单测,熟悉一下go的语法,但也进行的很困难(这是我第一段实习,之前都是springboot那一套,真不太熟悉这个)想问问大家的建议,就是我从现在开始到在开年回来之前应该做些什么,我目前就一个想法 就是复现一个landing手册上的go框架小项目 就是相当于帮自己锻炼锻炼怎么写go 或者各位大佬有没有更好的锻炼go语法的建议还有就是大家都在说vibe coding,那我应该怎么锻炼自己使用ai的能力,感觉我除了给一些需求然后它给我生成代码,好像就没别的用法了,那些什么工作流、拆解、skill啥的都不知道从哪一个地方开始,包括我现在正在实习,不知道精力该怎么分配,去网上想找找关于agent开发的一些学习流程,说实话,众说纷纭,有的是从python开始打基础然后系统学那些rag prompt langchain mcp等等,有的是说直接找一个github上的ai项目然后反复问ai,我确实有点迷茫,恳求各位大佬能留下你们宝贵的建议,我一定认真反复深刻学习有一说一 我觉得字节饭挺好吃的!
双非后端失败第N人:1. go语言我建议你让ai带着你先把基本语法速通了,然后再去用go重新刷你以前刷过的leetcode,这样熟悉起来很快 2. 直接看你们组go项目,里面用***比较复杂,然后把每一个语法现象都喂给ai,一点点看
字节跳动公司福利 1371人发布
点赞 评论 收藏
分享
评论
15
12
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务