阿里云大数据数仓面经

1.对 Hadoop 各组件之间通信所使用的 RPC协议的具体内容
2.Hadoop 中读数据的完整流程(包括客户端发起请求、与 NameNode 交互、与 DataNode交互等各环节)
3.在数据传输过程中,若 DataNode 突然挂掉,Hadoop 系统会如何处理(包括任务重试、数据副本恢复等机制)
4.HBase 源码的核心模块、关键类及底层实现窪捞轶货嶍瑛冶辑(如数据存储、读写流程等相关源码细节)
5.在 HBase 中构建二级索引时,通过何种方式或机制保证索引数据与原始数据的一致性(如事务控制、同步更新策略等
6.JVM 的具体架构(包括程序计数器、方法区虚拟机栈、本地方法栈、堆等组成部分);堆内存的划分的原理及适用场景;以及平时实际工作中是否会调整GC算法调整的依据是什么
7.JVM 参数中,-Xms(初始堆大小)和-Xmx(最大堆大小)仅设置其中一个,与同时设置两个且值相同的情况下,对 JVM 运行产生的具体区别
8.如何通过命令或工具查看当前 Java 进程中内存各代(新生代的 Eden 区、Survivor区,老年代等)的内存占比情况
9.用于查看 Java 进程中线程堆栈信息的具体命令(如 jstack 等)及使用方法
10.如何查看 Java 进程中某个对象的具体大小包括对象本身及引用的对象所占用的内存),可使用的命令或工具及操作步骤
11.排查堆内存泄露的方法,除了将堆内存Dump 出来用MAT(Memory AnalyzerTO01)分析之外,还有哪些更简单直接的排查方式
全部评论
都在我的知识盲区
点赞 回复 分享
发布于 11-15 00:50 安徽

相关推荐

【职位名称】 大数据开发实习生(数据仓库方向)——27届校招实习【工作地点】 北京【职位描述】参与商业化业务的 离线数据仓库建设 ,处理 PB 级超大规模用户行为数据(千亿级日增量),覆盖数据从产生到可视化的全生命周期服务;负责数据仓库模型设计、ETL 开发及指标看板建设,优化数据流、调度系统及查询引擎,降低数据使用门槛,保障系统稳定高效运行;参与数据治理工作,提升数据质量与易用性,支撑业务分析需求,推动数据价值落地;与分析师、研发及产品团队紧密协作,总结数据研究方法论,助力业务场景的深度应用。【职位要求】基础要求 :2027届毕业,本科及以上学历在读,计算机、数学、信息工程等相关专业优先;211 以上院校背景优先;技术能力 :熟悉数据仓库实施方法论及体系架构,掌握 SQL 语言;至少熟练 Java、Python、Scala 等编程语言中的一种;了解 Hive、Spark、clickhouse等分布式计算工具,有大数据开发或数仓实习经验者优先;软技能 :思路清晰,数据分析能力强,能独立分析并推动解决问题;沟通积极主动,具备良好的数理逻辑与业务好奇心;实习要求 :每周可实习 3 天及以上,连续实习 3 个月及以上(长期实习优先)有兴趣的话私聊我发简历--简历直达hr,大量实习hc,可转正,转正比例高
投递字节跳动等公司7个岗位
点赞 评论 收藏
分享
评论
1
6
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务