pdd数据分析面经
1. 平时做分析,主要会用到哪些数据表?分析的内容大概是什么样的?
2. 我们来深入聊聊你简历上的项目,具体的技术实现细节是怎样的?
3. 在数据预处理时,如果遇到异常值或者缺失值,你通常会怎么处理?
4. 如果遇到长尾分布的数据,或者训练样本不足的情况,有什么好的处理策略吗?
5. 能讲讲主成分分析(PCA)的原理吗?
6. 模型训练时,如果发生了过拟合,一般有哪些解决方法?
7. 数据倾斜问题了解吗?比如说正负样本比例严重失衡,你会怎么处理?
8. SQL 里,WHERE 和 HAVING 子句有什么区别?
查看1道真题和解析