小米 大数据 一面 二面(凉经)
9.6 一面 0.5h
1)手撕牛客sql原题,次日留存率
2)自我介绍
3)项目介绍
4)对项目的一些细节进行提问
5)MR工作流程
6)Hadoop的数据倾斜问题?产生原因?如何解决?
7)说下了解的数仓建模方式?
8)项目中用了哪些事实表和维度表?
9)数仓分层的好处?
10)从事大数据,得需要哪些品质或者待提升的地方?
没问什么专业问题,面试官反馈还不错
9.8 二面 0.5h
回答的不好
1)Hive修改列名会发生什么影响
2) HDFS上分区的文件,在Hive不创建分区表的情况下如何导入?
Kafka场景题
3)kafka能不能保证顺序一致性?如何保证?
4)offset存放在哪?
5)Kafka 生产者分区策略?消费者分区策略?
6)数仓建模方式?维度建模具体概念?
7)拉链表概念?缓慢变化维概念?
8)parquet和orc压缩格式的区别?
