26秋招快手数据开发面经
1.介绍一下项目以及项目中用到的一些大数据组件
2.HDFS的文件存储格式有哪些?
3.MapReduce过程,MapTask和ReduceTask个数怎么确定?
4.MapReduce阶段哪些因素会影响性能?
5.Flink和Spark Streaming的区别是什么?
6.Kafka的消息传递机制是怎样的?
7.大数据处理中的一致性、可靠性、可用性如何权衡?
8.数据仓库和数据湖的区别是什么?
9.Hive和传统数据库的区别?
10.Spark如何进行数据倾斜的优化?
2.HDFS的文件存储格式有哪些?
3.MapReduce过程,MapTask和ReduceTask个数怎么确定?
4.MapReduce阶段哪些因素会影响性能?
5.Flink和Spark Streaming的区别是什么?
6.Kafka的消息传递机制是怎样的?
7.大数据处理中的一致性、可靠性、可用性如何权衡?
8.数据仓库和数据湖的区别是什么?
9.Hive和传统数据库的区别?
10.Spark如何进行数据倾斜的优化?
全部评论
接好运
相关推荐
查看16道真题和解析 点赞 评论 收藏
分享
查看16道真题和解析 点赞 评论 收藏
分享