Shopee秋招 数据研发一面

1. 项目介绍
2. 实习部门的业务介绍
3. 工作中有什么数据倾斜的问题?
4. Spark 的内存管理机制是怎样的?OOM 问题是怎么造成的
5. 场景题:
不一定要局限于 Spark 的框架。
有一个很大的数组,这个数组有 1w 个元素,需要对这个数组从小到大进行一个全排序。但我们的内存没有那么多,磁盘够多。有没有什么办法以有限的内存,相对充足的磁盘空间来实现 1w 个元素的全排序
6. 介绍一下什么是 Spark Job,什么是 Stage
7. SQL 题 3 道。不难,题目忘了,用一些子查询窗口函数解的
8. 算法题 leetcode 56 合并区间  mid
全部评论
同遇到了这个场景题 不过是字节 且限定了大数据思想
点赞 回复 分享
发布于 01-15 10:57 北京

相关推荐

总所周知,数分岗是市面上常见的卖课重灾区,那么究竟数分需要什么技能呢?首先,你要确定自己做的是什么数分岗!如果你是数分运营,大概率要学的是BI工具和运营知识(更低端的会excel就行),属于是和业务结合较深的岗位,当然你也可以叫自己是数据支持(就是取数工具人啦),工作比起数据分析,更偏重运营,如果你是刚入行的,推不动业务改动的,那就是纯取数用的,同事领导给个结论,你负责拉数据佐证就好。(市面上相当多的人说数分简单,就是因为很多数分岗都是干这个的)如果你是真正的数据分析师,比如涉及到LTV预测的,收入预测的,这种需要用到机器学习的。那么就需要学习Python和机器学习(聚类,决策树等),这种才能算得上是数据“分析”,可以输出自己的观点,可以根据你的数据去驱动产品。包括我自己入职的数分岗,很大程度上也是数分运营。但是哪怕是我这种数分运营,我也是因为是计算机科班出身,会SQL语言、Python和机器学习被招进来的。如果真的有人想当数据运营(比较简单)的:推荐学excel,bi工具想更进一步当数据分析师的:推荐学了上面的东西之后,学Python和SQL语言(取数和清洗用),需要涉及预测的学机器学习。当然,数据分析师,最重要的是你分析的思维,如果只能做取数而做不到产出分析的,建议转数据中台。
为了入行xx岗,我学了_...
点赞 评论 收藏
分享
评论
点赞
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务