某手+用户数仓岗位 数仓实习面试题

1.数仓的概念

2.业务域怎么分的?

3.关于主题的说法,如何划分?

4.ADS的表如何分类,提交什么需求就叫什么表?

5. 数仓分层建设中,DWD、DWS、ADS哪一层最难?

经典问题争议:数仓分层建设中,DWD、DWS、ADS哪一层最难?

6.各层有多少张表,数据量?

7. 刚提到的数据资产建设,数据资产主要是放在那一层产出的?这块是怎么做的?

8.数仓跑了多久

9.hadoop的基本原理。hadoop3跑的啥,tez还是spark?

10.RDD的基本原理,弹性怎么理解

11.宽依赖和窄依赖

12.spark数据倾斜的问题

13.结果表: 客服名称,客户数 ,未完成对话数, 平均响应时间

全部评论
求避雷
点赞 回复 分享
发布于 2025-09-21 23:38 北京
哪家企业啊
点赞 回复 分享
发布于 2025-09-21 23:38 北京
耐挂王
点赞 回复 分享
发布于 2025-09-21 23:38 北京
接好运
点赞 回复 分享
发布于 2025-09-21 23:38 北京
名字透露下
点赞 回复 分享
发布于 2025-09-21 23:38 北京

相关推荐

从25年2月到现在,接触大数据开发已经有一年了,从MySQL,orcal,到flink首先就是写SQL,毕竟大家大部分都是SQLboy,SQLgirl,SQL是基础,可以在力扣牛客上多刷题。手撕常考!数开作为技术岗中最贴近业务的岗位,理解业务过程并进行数仓建模是最重要的一部分建模这块主要涉及,指标维度建设,数仓分层,讲解项目结合业务来讲.技术栈主要分离线和实时,实时门槛工资相对高一点,但应用场景比离线少很多,离线是数仓的基础。大数据技术栈主要是Hadoop生态圈,分布式的一些东西,也就是八股基础的得会,得理解整个架构运作流程,光背是记不住的Hadoop,hive,spark离线最核心的技术栈,也是八股最常考的,实时主要是spark,flink其次是一些数据处理框架kafka,etl转换工具知道一些,怎么用的大数据的框架搭起来比较麻烦,时间赶的不建议亲自搭环境,理解项目业务过程,这个项目做了什么,整个数据链路能讲清楚即可。技术栈的一些相关学习渠道,博主是在B站上找视频学的,也够用,时间赶学重点就行,结合八股来看。最后是算法手撕,本人算法很烂,除了大厂基本不考这个。出的题一般比较简单,会hot100就行个人经验来看,简历上有了实时项目,很少问Hadoop八股,更偏重spark和flink。项目还是以离线为主。实习发现实时数据只占很少一部分,离线是底盘有了实习经历就不咋问项目了
为了入行xx岗,我学了_...
点赞 评论 收藏
分享
不愿透露姓名的神秘牛友
01-08 02:40
点赞 评论 收藏
分享
评论
1
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务