数开面经

#找实习# #面经# #数据人offer决赛圈怎么选#
投的太多忘了什么公司了,打电话约面,面的时候发现偏推荐系统的业务,

1.自我介绍
2.项目太简单了,不太对口,面试官好像不太清楚数仓建模?问了点基础八股
3.HDFS的组成架构
4.HDFS读数据的流程
5.MapReduce的执行流程
6.spark的执行流程
7.sparkSQL中map和flatmap的区别
8.hive数据倾斜
9.hive内部表外部表区别
10.小文件处理
11.flume结构
12.flume丢失数据如何处理
13.推荐算法做过吗,机器学习这类(在学校学过,做的不太多,分类回归预测这些)
14. Hive和传统数据库区别(应该是HDFS作为存储数据库)
15. HDFS副本机制
16.spark on yarn和spark standalone区别
17.Python和Java哪个用的多,用来做什么

后面一直在问数据挖掘相关问题,感觉不是很对口,面试官说会反馈我这个情况,数据挖掘倒是也做过,和想找方向不是很统一。
全部评论
mark基础八股题
1 回复 分享
发布于 06-19 16:56 湖北
mark
点赞 回复 分享
发布于 06-20 17:04 湖北

相关推荐

【职位名称】 大数据开发实习生(数据仓库方向)——27届校招实习【工作地点】 北京【职位描述】参与商业化业务的 离线数据仓库建设 ,处理 PB 级超大规模用户行为数据(千亿级日增量),覆盖数据从产生到可视化的全生命周期服务;负责数据仓库模型设计、ETL 开发及指标看板建设,优化数据流、调度系统及查询引擎,降低数据使用门槛,保障系统稳定高效运行;参与数据治理工作,提升数据质量与易用性,支撑业务分析需求,推动数据价值落地;与分析师、研发及产品团队紧密协作,总结数据研究方法论,助力业务场景的深度应用。【职位要求】基础要求 :2027届毕业,本科及以上学历在读,计算机、数学、信息工程等相关专业优先;211 以上院校背景优先;技术能力 :熟悉数据仓库实施方法论及体系架构,掌握 SQL 语言;至少熟练 Java、Python、Scala 等编程语言中的一种;了解 Hive、Spark、clickhouse等分布式计算工具,有大数据开发或数仓实习经验者优先;软技能 :思路清晰,数据分析能力强,能独立分析并推动解决问题;沟通积极主动,具备良好的数理逻辑与业务好奇心;实习要求 :每周可实习 3 天及以上,连续实习 3 个月及以上(长期实习优先)有兴趣的话私聊我发简历--简历直达hr,大量实习hc,可转正,转正比例高
投递字节跳动等公司7个岗位
点赞 评论 收藏
分享
评论
3
20
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务