【数据分析岗】大厂面经(四)之腾讯面试真题

大厂真题梳理系列来啦!
前面六哥已经梳理了 【数据分析岗】字节、淘宝面试真题!


以及常见笔试题型 & 面试题型!


本篇,来拆解下呼声较高的

腾讯数分面试真题

含思路解析+考点

希望可以帮助到正在找工作的你。


============================================================================
本篇首发于六哥的工粽号:【数据攻略】
更多精彩求职干货,啥啥都有!~
dd 六哥:data-youdao,有更多资源近距离观摩~
============================================================================

------正文手动分割线------


-----正文手动分割线------

本文结构速览:

一、SQL题

二、机器学习与概率论

三、开放性问题



一、SQL题

▼ 面试真题1

现有一张用户活跃表(user_acttive)

字段结构如下:

  • date:日期

  • user_id:用户ID

  • device:设备类型

  • active_score:活跃度


问题① 请计算每日的用户次留率

解题思路:

① 表进行自关联,日期+1天错开匹配

② 当天数据不进行次留计算




问题②

根据不同设备,按照用户活跃度进行排名,并输出每个设备活跃度TOP100的用户ID及活跃日期、活跃度。

解题思路:

① 考察窗口函数
② 对于相同活跃度如何排名


Tips本篇使用rank()函数,若面试官想要唯一100行记录,需要使用row_number()函数,针对活跃度相同如何进行排名需和面试官确认逻辑。



面试真题2

除了distinct外还有什么方法可以去重?

解题思路:

SQL去重的方法主要有三种

① DISTINCT(题目中已提到)

② GROUP BY

③ ROW_NUMBER()函数


举例,比如在面试真题1中,需要对设备信息进行去重。






面试真题3

请说明以下函数区别
  • RANK()

  • ROW_NUMBER()

  • DENSE_RANK()


解题思路:
  • ROW_NUMBER()函数会依次进行排序且序号不相同

  • RANK()函数会依次排序如结果一样序号相同且会跳跃排名

  • DENSE_RANK()会依次排序如结果一样序号相同且不会跳跃排名

实操:假设现有以下学生成绩数据(student_socre)

现按照科目成绩进行排名:


输出结果如下:


详细的内容可参考牛客主页 文章:





二、机器学习&概率论


面试真题1
两个向量之间的相似性计算有什么方法?
解题思路:

相似性计算方法主要可以分为"距离类"和"相似度"

下面罗列一些常用的计算方法





Tips如果时间有限,建议针对不同类型选中一至两个重点了解和掌握。


面试真题2

AB实验如何进行假设检验?

解题思路:
① 确认原假设和备择假设
  • H0:实验组和对照组没有显著差异

  • H1:实验组和对照组有显著差异

② 构建检验统计量
  • 如果检验统计量服从标准正态分布,总体方差或样本量较大,可使用U检验

  • 如果检验统计量方差未知且样本量较少,可使用T检验

③ 确认显著性水平及拒绝域
  • 显著性水平:希望样本结果不可信程度达到多少时候就拒绝原假设H0,通常用希腊字母 α 表示,通常取0.01, 0.05, 0.1。



三、开放性问题


面试真题1
以王者荣耀为例,怎么划分用户的生命周期?

解题思路:
用户的生命周期划分定义如下:
(可根据实际业务情况做调整)

导入期:用户获取阶段,所有的新用户都是属于导入期。

成长期:注册登录并激活,首次体验王者荣耀游戏。

成熟期:深入使用王者荣耀游戏,如频繁登录,购买相关游戏产品,这部分用户对平台的贡献和收益最大。

休眠期:这个阶段的用户价值开始走下坡,从数据上的表现,例如,登录频率或购买频率下降,游戏时长下降等。

流失期:一段时间未登录的用户。具体时长可以以王者荣耀登录的用户间隔分布进行分析定义。





面试真题2

抖音如何从数据分析的角度进行内容分发?

解题思路:

问题可以转换为:如何给抖音用户进行内容推荐

这类问题的其中一种回答视角为:

划分为自己熟知的用户指标相关的问题。

其中一种拆解如下:


结合视频属性及特征,与用户数据进行双边匹配推荐。比如
  • 给博主的粉丝用户进行视频加权推荐
  • 同类型视频推荐

  • 同地域视频推荐(例如,抖音重推的同城业务)

  • ...


Tips 面试A公司结果被问到B公司的业务问题,可以分成两种情况:

① A和B公司业务存在相似的地方,或者属于竞对关系;

② 面试官对B公司业务较为熟悉,会偏好于熟悉的领域进行发问。



以上就是腾讯面试的部分真题。


#数据分析##数据分析师##春招##面经##校招##社招##数据分析工程师#
全部评论
可惜我连面试机会都拿不到
1 回复 分享
发布于 2022-03-14 15:24

相关推荐

1.第一种人呢以92和计算机强双非(四邮四电)偏多,这种人呢,喜欢把自己的学校称为“大专”,极力在交流时贬低自己的学历,放大自己学历的缺点(如牛客经典贴,双非秋招oc美团,点开发现是985硕士🤣🤣🤣),说的自己学校好像比双非认可度还低,好像这样才能突出自己多么牛逼,克服了多少困难,技术有多强,但你要是说想双非考研去他们学校,他们又要狠狠打压你,告诉考他们学校多难了🤣🤣🤣。从92到大厂明明是证明自己一直优秀的一条路,你不走,你非要故意恶心自己也恶心别人,何必呢?2.第二种人以像我一样的双非同学偏多,大多学历比较低,可能又带有中大厂实习。他们会在你交流的时候,十分刻意的强调自己是弱双非或者学院本,再不经意透露自己在某某大厂实习。等着群聊里响起“原来是xx(大厂名字)✌🏻啊,给你跪了😭”,他们便心满意足了。不用反驳,因为我之前也是这种人,现在也有这种倾向😆😆😆。3.第三种人更是神人,跟这种人交流时,你会觉得对方已经被美国植入芯片控制了,张嘴闭嘴只有膜膜膜,羡慕羡慕羡慕。上到拿到大厂offer,下到喝一杯奶茶,他们都说羡慕。不知道他们的生活过得有多么悲惨,连喝杯饮料都到了羡慕的地步🤣🤣🤣。天天就是在群里面互相吹捧,互相羡慕,不知道交流起来有什么意思。4.第四种人则是第一种人的对立面,我有时候觉得是第四种人太多才会导致第一种人的出现。这种人天生带着对92的恨。仿佛学计算机没有拿到offer全是92导致的。他们是小说里被陷害的白莲花女主,92则是夺走他们人生的恶毒女配。在他们的眼中,他们的技术要比92好一百倍,但是所有企业都识别不了他们这匹千里马。实际自己从来没想过,在ai与辅导课程普及的当日,所谓的计算机,早已经没有了任何的技术壁垒,否则也不会有那么人转码了😂。这是那天回家路上发抖音的,讨论不少,有赞同有不赞同的,其实有时候也在想自己言论是否偏激。今天遇到朋友问我好久没更新牛客了,就搬了上去。其实很简单,加了交流群之后,发现交流的质量参差不齐,有些实在言之无物,想了想自己也会有这样的问题。自己也在建交流群,希望能避免这样的现象吧
wu970:交流群不就是一群人互相装逼和加装谦虚吗
如何排解工作中的焦虑
点赞 评论 收藏
分享
评论
28
224
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务