拼多多数据分析面试1|秋招三面
一面HR面,20分钟
1. 意向城市。
2. 未来发展城市。
3. 家里人对未来工作城市的看法。
4. 现在已经拿到的offer,在面试流程中的公司。
5. 在现在实习的公司最大的感受。
6. 现在的实习能不能转正?
7. 讲一个实习中印象最深刻的项目。
8. 你在这个项目中最大的挑战。
9. 现在回顾这个项目,你觉得有什么可以改进吗?
10. 领导总是让你做你不喜欢做的事情,你会怎么办?
11. 对拼多多的了解。
12. 讲一个你性格中的优点和缺点。
13. 理想薪资。
二面业务面,30分钟
1. 自我介绍。
2. 为什么觉得自己逻辑能力和学习能力强,举例论证。
3. 你认为机器学习在数据分析中起到什么样的作用?
4. 聊了一下最近一次实习的项目。
5. 项目中的特征怎么选取的?
6. 讲一下假设检验。
7. 假设检验的应用场景。
8. 因果关系和相关关系的区别。
9. 一个天平和七个砝码,其中五个一样重,另外两个稍轻,问把这两个轻的找出来,最快需要称几次?(3次)
10. 开放题:我现在有一个问题,需要你找出原因,接下来你可以问我问题,我会回答你的提问,最后你要告诉我正确答案,限制问10个问题。问题是,猪死了,为什么?
11. 反问。
三面业务面,50分钟,偏技术
1. 自我介绍。
2. 数据挖掘项目介绍。为什么这样定目标?为什么要做分类?样本是什么?样本量多少?为什么不采用另一种方式提取特征?预测的时间范围?最后效果如何?如何在业务上验证有效而不是在验证集上?
3. 另一个项目,涉及综合评价,主成分分析PCA,因子分析FA。PCA从数据到最后结果的流程?每一步数据如何处理?选取了几个主成分?怎么确定的主成分数量?怎样从主成分到综合分数?
4. SQL题:订单表,有ord_id, mall_id, goods_id, sale_number, amount,求每个商店里的商品价格的中位数。
5. MySQL数据库,表的主键只能是一列,还是可以多列?(我理解成了可以有几个主键,面试官想问的是主键能否是列的组合)
6. 平时主要用Python做什么?会做策略和算法吗?
7. GBDT和XGBoost的区别?基学习器?为什么GBDT用的是树?我提到了CART树,面试官问可以用别的树吗?GBDT可以用线性的基学习器吗?为什么XGBoost可以用线性的基学习器?(梯度提升树才是Boosting类的根基,GBDT不能用线性,关键点在于没有L1、L2正则项,可以与Lasso回归与岭回归结合来说,XGBoost可以因为有正则项。
8. 对拼多多的理解?对拼多多产品提一提看法?(我提到朋友分享的砍价页面)
9. 砍价页面,不同的用户点进来,每个用户每一刀砍掉多少钱?你怎么设计,写个函数吧。(我说每一个砍价商品应该都有一个原始价和成交价,这中间的差价会随着每一次砍价点击而减少,那每一个用户点进来,砍价的上限就是当前价格跟成交价之间的差价。以最大差价做为基准,给每个用户点进来可以砍掉的价格随机设定百分比,其中新客户的百分比区间较高,老客户的随机百分比区间更低,起到部分的新客引流作用。这个回答考虑不周全)
10. 你怎么验证刚刚提到的砍价策略是有效的?需要哪些数据指标?(我提到砍完价之后的成交率)
11. 砍价的成交率越高越好还是越低越好?(成交率越低越好,面试官解释这里边售价与成本价之间,一般不存在利润空间,主要收入来源不是卖东西的利润,而是广告流量)
一面10题:想考察思考问题的框架,应该先问时间、地点、猪的数量、周围环境等。个人理解类似决策树的分支策略,要使得树的高度小且所涵盖的信息量多。下面有两个类似的网站小游戏可以玩一下,提问仅需回答是与否,猜出心中所想的东西。
20Q:猜大多数人熟悉,不能是特定的人物、地点或事件。我想的大熊猫,在第24问猜出来。
Akinator:猜人物。我想的樱木花道,在第7轮被猜出来。
#数据分析##数据分析师##拼多多##数据分析面试##数据科学#
OPPO公司福利 1114人发布