2022秋招大数据开发工程师面经分享

楼主本人是美国留学生,还要冒着危险去美国上线下课,也没有办法提前实习,求职之路充满了艰辛。。今天终于收到了字节跳动的大数据开发工程师意向书,算是秋招的一次阶段性胜利。自此腾出一些时间来分享下之前各公司的面经,希望对大家有帮助。
本帖会持续性更新,我慢慢写,哈哈哈。。。。而且因为有些已经比较久远,记不太清了,我会尽量把记住的写下来

百度(搜索技术平台--数据开发工程师)
结果:楼主8.4号三面完毕,8.6没忍住给面试官发了邮件问结果,面试官回复说“表现很好,不用担心,在走流程”,不过现在依然没收到测评,还在泡池子中。。。
综合体验:面试官都非常爽快,面试之前都说了只挑你会的问,而且一面二面都是当场告诉我通过了,体验非常好(不过三面被泡池子了。。)三面主管面没有问啥技术问题,主管非常滴和蔼可亲~
一面:
数仓分层
spark提交任务的流程
spark broadcast的原理
两道sql(行列转换,窗口函数)
本来还要靠算法的,看时间没剩多久了就没考,说二面再考(结果二面也没考😂)
二面:
mapreduce流程
对hdfs的了解
mysql的存储引擎(我一时没想起来。。扯了点别的)
java创建线程的方式
知不知道数据结构?
(二面只面了30分钟,也是当场给了通过
三面:
(闲聊了一个小时哈哈哈。。
研究生java课的一个项目
实习收获
大学社团
最无法忍受的室友的行为
学的课程里哪门是最难的?怎么学的?
说一个你做了不认可的事情的例子

字节跳动(data数据平台--数据开发工程师):
结果:8.18意向书
综合体验:也是给答复非常快,基本都在面试完的1~2小时内约下一面,意向书HR面完一小时之后就发了
(一开始是一个更偏向业务的组
一面:
挖简历,中间穿插一些spark基础知识,数据存储啥的(我太能说了,这一part结束已经45分钟过去了。。)
UDF的三种类型
(然后竟然要问统计,我说我没复习,就问了简单的
怎么判断数据的离散程度?
数据的量级相差特别大怎么办?
(然后还问了业务
抖音计划做一个NBA的板块,怎么衡量成本与收益
一道sql(窗口函数)
二面:
两道sql(窗口函数agaaaaaain)
spark提交任务的流程
数仓分层
感觉这个面试官有点在意我不能实习。。我也觉得他们这个组有点偏数分,当然我并不是很介意,然后就把我转到同部门的另一个组了
(转到了一个做底层框架优化的组
一面:
挖简历
synchronized 和 ReentrantLock区别
DNS解析域名过程
算法:
1. 输入int n, 返回他的二进制有几个1
2. 输入int n, 返回二进制[1,n]一共有几个1
二面:
二面太顺利了没有答不上来的问题,完全忘了都问了啥,只记得下面俩
算法:二叉树前序遍历不用递归
sql(非常简单的聚合)
三面:
挖简历
== 和 equals的区别
HashMap 的key用自定义类需要做什么
HashMap 线程安全,手写
算法:二叉树蛇形层次遍历
四面主管面:
不太算是技术面
挑两个实习项目,说一下接到任务后是怎么开展工作的,中间也有探讨一些技术细节,比如还能怎么优化之类的
学校课程
职业规划
然后主管介绍一些部门架构,说HR很快会联系你(我窃喜哈哈哈
HR面:
就不多写了,我感觉HR面不刷人,就是来问想base在哪的。问题很常规,如实回答就好

腾讯(技术中台--后端开发工程师):
结果:二面挂
综合体验:腾讯没有数开岗位,我投了运营开发,然后被后端的捞了,本着学习的态度去面了一下。一面感觉是压力面,面试官比较push人,各种follow up。二面就不多说了。。感觉自己还有很大不足
一面:
ArrayList LinkedList区别
HashMap
JVM结构
本地方法栈
对象放在哪?
垃圾回收器及应用场景
happens before
volatile
ThreadLocal
设计秒杀系统(各种抠细节追问,彻底被绕晕)
算法:leetcode 322
二面:
java最新版本是多少?你用的什么版本?最新版有什么改进?(。。。)
挖简历(因为面试官不太懂数据开发,所以比数据开发问的还细。。)
算法:判断域名A是不是B的子域

#字节跳动秋招提前批##面经##校招##百度##字节跳动##大数据开发工程师##腾讯#
全部评论
cmu 太强了
1 回复 分享
发布于 2021-08-18 22:16
同三面被泡池子,也是百度大搜,做上层排序。。。
点赞 回复 分享
发布于 2021-08-25 00:34
腾讯你面的是哪个部门,在官网上没看到数据研发的岗位
点赞 回复 分享
发布于 2021-08-24 19:42

相关推荐

点赞 评论 收藏
分享
一、MySQL 相关慢查询监控:如何实现慢查询监控?具体实现方式(脚本如何工作)?数据量级:项目核心表的数据量级是多少?如何插入大量测试数据(如1100万条)?插入过程中遇到了什么问题(如查询变慢)?如何分析和优化?索引:B+树的层级概念、原理和自平衡机制。叶子节点存储的内容(聚簇索引 vs 非聚簇索引)。回表操作的流程。联合索引的原理和最左前缀原则。还有哪些其他索引类型?事务与锁:MVCC(多版本并发控制)的实现原理,如何保证事务顺序和避免冲突?MySQL 有哪些锁(行锁、表锁)?产生原因?SELECT ... FOR UPDATE是什么锁?日志:redo log、undo log、binlog的定位和作用分别是什么?基础架构:了解 MySQL 的基础组件吗(如连接器、分析器)?数据库范式:了解哪些数据库范式(第一范式、第二范式等)?二、Redis 相关数据结构:Redis 有哪些基础数据结构?它们的应用场景和底层实现是什么?排序实现:ZSET如何实现排序?底层数据结构(跳表)如何工作?数据结构对比:Redis 的跳表和 MySQL 的 B+树有什么区别?Redis vs MySQL:Redis 和 MySQL 的根本区别是什么?持久化:Redis 基于内存,如何实现数据持久化?过期策略:Redis 的过期键删除策略是什么?三、Kubernetes (K8S) 相关基础架构:能介绍一下 K8S 的基本架构吗?核心组件:Ingress是什么?配置文件:了解或写过 K8S 的 YAML 文件吗?四、Linux 相关进程通信:Linux 进程间通信的方式有哪些?内存管理:页表区别?物理地址、虚拟地址、逻辑地址的区别?用户态/内核态:用户态和内核态的区别?什么时候会发生切换?常用命令:用过哪些 Linux 命令?grep -R和 ls -a参数的作用?五、算法能力编程题:现场编写代码解决“最长有效括号”问题,并解释解题思路。六、个人情况与软技能实习时间预计可以实习多久?学习习惯:最近在看什么书?平时如何解决技术问题?面完我还自我感觉良好,怎么反问说有欠缺啊,不知道有没有机会
查看29道真题和解析
点赞 评论 收藏
分享
评论
12
59
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务