迟到的面经-抖音暑期数仓一面

1. 实习日常工作都做什么
2. 数仓的分层,主题域
3. 流量域ods层上游数据源是什么,整体的数据加工链路
4. 介绍一下spark,当下能想到的所有关于spark的内容
5. rdd弹性数据集,弹性体现在哪些方面
6. 引起数据倾斜,spark-ui的看法
7. 数仓基建,模型改造是怎么做的,背景是什么
8. 简历上的旧任务迭代具体是什么
9. 任务优化,主键是什么,具体怎么做的,任务执行为什么慢
10. 数仓用户域的改造(个人项目
11. spark的任务提交和执行流程
12. 怎么评价一个模型设计的是好是坏
13. hdfs的读写流程,为什么是三个副本
14. 知道温存吗,生命周期是什么
15. python装饰器是什么。。。。。。
16. 小文件产生原因及危害
17. Sql 两个简单group by 一个留存率 一个连续登录
18. 算法题:移动最少区间个数 使得剩余区间无重叠
  1. 输入:[1,2][2,3][4,6][1,3]
  2. 输出:1
  3. 解释:移除[1,3]后,剩余区间无重叠
19. 算法题:链表的两数相加
全部评论
看到第4题没绷住,万恶的面试官😂
点赞 回复 分享
发布于 05-26 14:47 上海

相关推荐

【职位名称】 大数据开发实习生(数据仓库方向)——27届校招实习【工作地点】 北京【职位描述】参与商业化业务的 离线数据仓库建设 ,处理 PB 级超大规模用户行为数据(千亿级日增量),覆盖数据从产生到可视化的全生命周期服务;负责数据仓库模型设计、ETL 开发及指标看板建设,优化数据流、调度系统及查询引擎,降低数据使用门槛,保障系统稳定高效运行;参与数据治理工作,提升数据质量与易用性,支撑业务分析需求,推动数据价值落地;与分析师、研发及产品团队紧密协作,总结数据研究方法论,助力业务场景的深度应用。【职位要求】基础要求 :2027届毕业,本科及以上学历在读,计算机、数学、信息工程等相关专业优先;211 以上院校背景优先;技术能力 :熟悉数据仓库实施方法论及体系架构,掌握 SQL 语言;至少熟练 Java、Python、Scala 等编程语言中的一种;了解 Hive、Spark、clickhouse等分布式计算工具,有大数据开发或数仓实习经验者优先;软技能 :思路清晰,数据分析能力强,能独立分析并推动解决问题;沟通积极主动,具备良好的数理逻辑与业务好奇心;实习要求 :每周可实习 3 天及以上,连续实习 3 个月及以上(长期实习优先)有兴趣的话私聊我发简历--简历直达hr,大量实习hc,可转正,转正比例高
投递字节跳动等公司7个岗位
点赞 评论 收藏
分享
评论
3
15
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务