滴滴校招数据开发一面面经
1.mapreduce执行流程
2.hdfs如何保证数据一致性
3.flink和kafka如何保证数据的一致性
4.flink的checkpoint里的barrier对齐和非对齐分别如何实现exactly-once;非对齐实现需要怎么做?
5.kafka如何保证数据一致性
6.spark和mr的shuffle有哪些区别
7.spark的内存参数一般怎么调整;一般集群的spark内存参数会在什么样的一个级别?
8.数仓分层,每一层有什么作用?具体的全链路流程是什么样的?
9.维表应该如何进行设计?
10.用户画像如何搭建?
11.然后是一些数据结构的考察。
12.然后是两道sparksql题,不难。其中一个是考察数据构造,需要对sparksql有较深的使用了解。
2.hdfs如何保证数据一致性
3.flink和kafka如何保证数据的一致性
4.flink的checkpoint里的barrier对齐和非对齐分别如何实现exactly-once;非对齐实现需要怎么做?
5.kafka如何保证数据一致性
6.spark和mr的shuffle有哪些区别
7.spark的内存参数一般怎么调整;一般集群的spark内存参数会在什么样的一个级别?
8.数仓分层,每一层有什么作用?具体的全链路流程是什么样的?
9.维表应该如何进行设计?
10.用户画像如何搭建?
11.然后是一些数据结构的考察。
12.然后是两道sparksql题,不难。其中一个是考察数据构造,需要对sparksql有较深的使用了解。
全部评论

感觉似乎都是面试八股
滴滴这么晚面试啊
楼主知道二面时间吗?我的进度一面过后卡住了
大佬求问第七题是怎么答的哇
相关推荐
反装笔大队长:分情况吧。需求分业务需求和技术需求,技术需求你说的是对的。像CRM、OA、NC等等,这些业务系统很多时候对技术要求并不高的,不可否认的是 这些需求还是很不错的。
NC系统的进销存。实际上只是对仓库、库位、库存量、入库出库单价、数据报表等数据的统计与计算。CRM的市场活动、人面画像分析与统计、客户信息管理等,这些无非都是一些增删改查。对于业务需求面试官通常都是问你对业务的理解与过往对该业务的处理方案,并不会死磕技术。技术肯定是多多益善,但在业务开发中 正在有意义的是你的经历。 点赞 评论 收藏
分享
查看16道真题和解析 点赞 评论 收藏
分享
