给27届家人找实习的经验分享
26届数据开发校招薪资如下
以下薪资均来自语兴统计
公司 | 范围 | 白菜 | sp+期权 | ssp+期权 |
美团 | 23-30k | 23-25k | 25-27k | 28-30k |
小红书 | 30-40k | 30k | 35k | 40k |
京东 | 28-31k | 28k | 29-30k | 31k(实时数开能拿到33k) |
字节 | 28-38k | 28-30k | 33k附近 | 36-38k |
虾皮 | 23-32k | 23-25k | 27-29k | 32k |
腾讯 | 27-33k | 27-28k | 29-30k | 32k |
快手 | 26-36k | 26-28k | 30.5-34k | 36k |
百度 | 24-未知 | 24k | 26k | 暂时没人拿到缺少数据参考 |
淘天/阿里系 | 25-33k | 25k | 26k-28k | 33k |
米哈游 | 未知-33k | 暂时没人拿到缺少数据参考 | 31k | 33k |
滴滴 | 21k-未知 | 21-23k | 26-27k | 暂时没人拿到缺少数据参考 |
携程 | 25k-未知 | 25k | 27k | 暂时没人拿到缺少数据参考 |
b站 | 未知-未知 | 暂时没人拿到缺少数据参考 | 28.5k | 暂时没人拿到缺少数据参考 |
哈啰 | 未知-未知 | 暂时没人拿到缺少数据参考 | 小sp 22k | 暂时没人拿到缺少数据参考 |
多多 | 25k-未知 | 25k | 29k | 暂时没人拿到缺少数据参考 |
小鹏 | 未知-未知 | 暂时没人拿到缺少数据参考 | 28k | 暂时没人拿到缺少数据参考 |
给27届家人找实习的经验分享
1. 先跟大家简单自我介绍下
26届硕士
星球练习时长1年半
5段大厂实习,数分-->数开
2. 实习考察要素
一定一定要有垂直的实习经验或者项目经历。大厂招日常实习生,目的还是希望你能替团队分担一些脏活累活,筛选出将培养成本能降到最低的候选人。那以下三点就是对候选人重点考察的一些方向了。
- 第一是实习,项目垂不垂:首先数开最主要的工作就是写sql,建表,搭看板,如果你有数据分析,数据科学,甚至数据运营相关的实习经历,这完全可以作为强背书证明你熟悉实际sql生产环境,上手过数据相关的平台,并且具有能编写复杂sql的一些能力。其次就是垂直的项目,这里我认为垂直的项目优先级绝对是top,这证明了你对数开这个岗位是有概念的,知道大概的工作流程,工作内容,工作方向是怎么样的。
- 第二是专业素养,技术素养:比如说考察你对大数据技术栈的理解程度,一些常见八股能不能背,有没有思路;对数仓分层的理解,能不能映射到实际的项目中。还有就是基础技术素养,比如对408,mysql,以及算法题的考核。
- 第三是软实力:比如说你这个人的逻辑能力,沟通能力等软实力,以及对岗位的意愿程度,实习时间能不能有保证。
3. 面试准备
大厂数据开发实习面试一般分2轮技术面(有的加HR面),每轮的侧重点会不一样,
但是核心点永远都是 技术八股+对口的项目
(1)1面:我理解是实习最重要的一场面试
1面面试官一般都是自己的mentor,对于日常实习来说,mentor认可你了大概率就有了
- SQL必须练熟:有些日常实习面试会问一些很基础的sql题目,比如三种排序开窗的区别。面数开还是要把sql练扎实,我是把leetcode50刷了一遍,兴哥群里也会推sql的题目,可以跟着进阶做一下。手撕是一定的,不过日常实习不会很难,窗口函数,留存,直播间最大在线人数,连续登录都刷一下。
- 数仓基础概念要能说清:比如星型模型/雪花模型差异,数仓分层是怎么样的。这里是数仓的核心中的核心,也就是数据建模部分。建议问分层的时候可以不止是简单的答出5层,而是结合项目说一下自己项目里的分层架构是怎么样的,每一层比较典型的数据模型是啥样的。
- 基础技术能力,软实力:比如大数据常见八股,数据倾斜,spark执行流程,mr和spark的区别。以及408常见八股比如线程与进程,三次握手,mysql索引,存储引擎。常见算法题:排序,链表,二叉树。还是建议例如大数据八股的时候,能结合项目讲的就引到项目上去,1是体现你有实操,2是背八股太生硬。
- 项目的介绍:写在简历上的每一个点每一个词儿一定要吃熟,一面可能不会深挖但是会问你干了啥,写的点对应了啥,自己的项目一定不能说不出来。
(2)2面:一般1面已经决定了,不过某些组二面也有筛选性
2面一般是自己的ld,八股的拷问会稍微少一些,更多的是对项目经验上的深挖
- 讲项目的时候突出全局性:比如我只做了应用层hive表和看板的建设,但是我对上游公共层的表也有概念。比如我在应用层建设的时候仍然会以数仓建模的思路,建设一些专为集市服务的维表,以及某个特定活动圈选出来的人群,会多放一些常见维度和常见指标,方便活动后续对这些人群进一步分析。以及这个表有了一定复用性后,可以考虑下沉到公共层进行建设。 或者在数据质量上对模型有着什么样的保障。
- 对岗位的理解以及意愿程度:能比较清楚的认知数仓在公司里具体是干啥,职责是怎么样的。实习的天数,时间,愿不愿意在这个岗位上深耕。
4. 实习中注意的点
日常实习主要以学东西为主,少考虑转正除非是阿里美团暑期(几率很小),
(1)学习平台
数仓开发会涉及到很多平台,预期是能知道每个平台在干嘛,我在哪个环节会用到哪个平台,意义是啥。理解平台对于理解开发全链路涉及到的方方面面都有帮助。比如数据探查平台(presto加速),数据地图(找表),开发平台(开发任务),数据质量平台(配置dqc,数据对比),数据集(底层olap,方便业务自行多维分析)
(2)学习组内数仓架构
可以借着需求,对涉及到的模型做梳理,看看为什么要这么建设以及为什么要有这些维度指标;以及可以对上下游做一个梳理,看看这个需求血缘架构是怎么样的,对团队内的数据资产有更好的理解,而不是单单的对自己域有理解。
(3)多看看组内在干啥
一般周会,双周会实习生都可以参加,可以看看团队里面每个人都在干啥,专项是怎么样的。
现在常见的专项有
- 架构重构优化,多学习下原来的架构为啥要优化,优化的点在哪,优化后是什么样
- 存储计算优化
- 质量保障
- 新技术的落地,比如paimon表,流批一体,data agent
(4)先写简历后离职
建议在离职前至少半个月前,就开始写简历准备面试;一方面总结一下你在这段实习中的收获,总结下你的项目;另外也建议离职前拿着新简历面两次,别人往往会帮你找出你新项目的bug,趁着还有权限赶紧充实项目。
(5)干就完了
最后的最后,想说的就只有四个字:“干就完了”,很多同学担心面评呀,担心学校的课呀这些。没关系,吃下兴哥的项目,基础知识打牢,就可以多投多面多练。最后一定能进大厂实习的!
#27届实习##java##数据人offer决赛圈怎么选##数据分析##数据人的面试交流地#
查看3道真题和解析