数据挖掘面经

投的一家朋友在的外企数据挖掘仅记录下面经
无心插柳offer+1,(但还是想去大厂做数分 许愿帖)
数据挖掘考察问题

1 项目经历:问卷数据处理逻辑

  • 多数据源数据匹配、数据填充
  • 数据清理:答题时间短、空题过多、逻辑倒挂、态度消极
  • 去重:口径 同人/天/店仅保留最晚的一笔交易
2 建模经历:
用了什么算法:决策树、随机森林
怎么判断、处理过拟合:比较训练集score》测试集score;减少n_estimator、剪枝
怎么划分数据集和测试集:train_test_split or cross_val_score
数据缺失怎么处理(数据量很大情况):1 业务角度判断是否有用 2 判断数值型 or 非数值型 3 填补(略)
决策树中如何判断单指标对因变量影响:调用参数importance,看决策树特征因子大小
如何判断单指标对因变量是否显著:想考我特征选择,当时没答出来
复盘:从方差、相关性、F检验等角度选择方差更大、相关性显著、卡方检验显著的
3 反问
公司业务:确认过眼神,不是我感兴趣的坑
但面试体验太棒了,面试官很温柔,提问也清晰,记录下今日份开心
#数据挖掘##面经#
全部评论
方便问下是哪家外企么,如果可以的话私信我噢,感谢
点赞 回复 分享
发布于 2021-08-14 11:42
想问下是哪家公司啊
点赞 回复 分享
发布于 2021-03-16 16:20
请问楼主面的哪家外企呀
点赞 回复 分享
发布于 2021-03-16 00:30
楼主你好,请问你是实习、校招还是社招?
点赞 回复 分享
发布于 2020-12-07 17:02

相关推荐

想干测开的tomca...:让我来压力你!!!: 这份简历看着“技术词堆得满”,实则是“虚胖没干货”,槽点一抓一大把: 1. **项目描述是“技术名词报菜名”,没半分自己的实际价值** 不管是IntelliDoc还是人人探店,全是堆Redis、Elasticsearch、RAG这些时髦词,但你到底干了啥?“基于Redis Bitmap管理分片”是你写了核心逻辑还是只调用了API?“QPS提升至1500”是你独立压测优化的,还是团队成果你蹭着写?全程没“我负责XX模块”“解决了XX具体问题”,纯把技术文档里的术语扒下来凑字数,看着像“知道名词但没实际动手”的实习生抄的。 2. **短项目塞满超纲技术点,可信度直接***** IntelliDoc就干了5个月,又是RAG又是大模型流式响应又是RBAC权限,这堆活儿正经团队分工干都得小半年,你一个后端开发5个月能吃透这么多?明显是把能想到的技术全往里面塞,生怕别人知道你实际只做了个文件上传——这种“技术堆砌式造假”,面试官一眼就能看出水分。 3. **技能栏是“模糊词混子集合”,没半点硬核度** “熟悉HashMap底层”“了解JVM内存模型”——“熟悉”是能手写扩容逻辑?“了解”是能排查GC问题?全是模棱两可的词,既没对应项目里的实践,也没体现深度,等于白写;项目里用了Elasticsearch的KNN检索,技能栏里提都没提具体掌握程度,明显是“用过但不懂”的硬凑。 4. **教育背景和自我评价全是“无效信息垃圾”** GPA前10%这么好的牌,只列“Java程序设计”这种基础课,分布式、微服务这些后端核心课提都不提,白瞎了专业优势;自我评价那堆“积极认真、细心负责”,是从招聘网站抄的模板吧?没有任何和项目挂钩的具体事例,比如“解决过XX bug”“优化过XX性能”,纯废话,看完等于没看。 总结:这简历是“技术名词缝合怪+自我感动式凑数”,看着像“背了后端技术栈名词的应届生”,实则没干货、没重点、没可信度——面试官扫30秒就会丢一边,因为连“你能干嘛”都没说清楚。
点赞 评论 收藏
分享
评论
4
24
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务