1、自我介绍 2、谈一谈你对HBase的理解。 3、HBase中如果遇到同样多的列数,多列族少列限定符,和少列族多列限定符,如何设计和选择? 4、HBase中rowkey的设计? 5、HBase的Get和Scan的区别和联系? 6、谈一谈什么是RDD及你对RDD的理解。 7、宽依赖算子举例? 8、MapReduce的Shuffle和Spark的Shuffle异同?谈一谈各自的特点和过程。 9、了解流处理么? 10、SparkSQL你们文件读取的是什么格式? 11、Hive中遇到数据倾斜如何解决?(hive.groupby.skewindata了解么、ma...