07-25 23:28 网易_数据开发工程师

发布于上海

关注

大表关联大表倾斜（100亿 join 50亿）

昨晚有同学提到面试中问大表关联怎么调优（100亿 join 50亿，无聚合函数） 前置判断：需要判断两张表关联键是否是1对多、1对1，如果a、b表是多对多还是会倾斜 分析误区：加盐/打散，题目中只是提到将两张表进行关联，因此这里无论是加随机数还是、取模都是无效的（因为关联不到一起） 分析思路： （1）map端减少输入：通过on中过滤及谓词下推可限制关联表数据，例如过滤时间、过滤枚举、限制分区（2）大key拆解：可以写sql by维度找到热点key分布，可以按照维度（例如一级类目、场景，但要保障相同）进行拆表，分批插入目标表（目标表也可以根据大维度去做二级分区，或者先做一个临时表也行）（3）预聚合：例如关联表是单事务日志（状态变化便产生一条数据），可进行预聚合，多条取最新数据，聚合后再进行关联（4）分区：重分区加task，distribute by，保障分区数据均匀，增加多任务去分担压力，只能作为缓解，治标不治本（5）参数：常用还是 SET spark.sql.adaptive.skewJoin.enabled=true;（join负载均衡） SET spark.sql.autoBroadcastJoinThreshold=10485760;（广播） SET spark.sql.shuffle.partitions=2000;（shuffle并行）sparkjava

#数据分析##数据人offer决赛圈怎么选##数据人的面试交流地##你今年的平均薪资是多少？##牛客创作赏金赛#

全部评论

推荐最新楼层

昨天 18:20

阿里云_研发工程师JAVA(准入职员工)

阿里云内推，阿里云内推码

入职一个多月了，来分享一些landing的感受～ 整体说下：可以打85分，毕竟当时辞职就是想要走出舒适圈，的确也会有些不舒适，但基本上是因为阿里和网易风格有差别，需要一些时间适应 我所在的产品线整体风格不卷，加班不严重，周末大家都安排自己的生活，可以安心放下手机，也让我彻底放下“不秒回羞耻症” 阿里云团队规模太大，分工很细，人也很多，想搞清楚一件事情要对接好多好多人，要熟悉的流程也贼多，这个过程的确有些累，但我估计只要在大厂都会这样 感觉这边做事情自由度更高，换句话说，老板只要结果，过程怎么做自己想办法去 凡事凡人都爱讲价值。初次对接的其他部门的同事，也会直接问我，“你对业务的价值是什么” 前...

阿里云工作强度 727人发布

点赞评论收藏

分享

12-15 21:43

已编辑

乐读_java开发(实习员工)

乐读实习offer

bg双非本9硕无实习，乐读实习转正offer@黑皮白袜臭脚体育生

点赞评论收藏

分享

11-19 17:50

西北政法大学新媒体运营

程序员花海：实习和校招简历正确格式应该是教育背景+实习+项目经历+个人评价其中项目经历注意要体现业务实习经历里面的业务更是要自圆其说简历模板尽可能保持干净整洁不要太花哨的

秋招吐槽大会

点赞评论收藏

分享

10-29 11:31

吉林大学 Java

后端转后厨_：后端就是个**

点赞评论收藏

分享

12-14 22:54

武汉大学 Java

20251213【鹰角网络】笔试算法真题（共1题）

题目1：塔防游戏

投递鹰角网络等公司6个岗位

点赞评论收藏

分享

评论

1

3

招聘动态

出海营销领先企业钛动科技

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 实习简历求拷打 #

7061次浏览 94人参与

# 担心入职之后被发现很菜怎么办 #

265027次浏览 1122人参与

# 秋招被挂春招仍然能投的公司 #

5337次浏览 88人参与

# mt对你说过最有启发的一句话 #

31174次浏览 382人参与

# 什么是优秀的实习经历 #

7173次浏览 194人参与

# 考研失败就一定是坏事吗？ #

199475次浏览 1361人参与

# 为了找工作你花了哪些钱？ #

74631次浏览 359人参与

# 摸鱼被leader发现了怎么办 #

97778次浏览 625人参与

# 秋招特别不鸣谢 #

14223次浏览 172人参与

# 选实习，你更看重哪方面？ #

12317次浏览 205人参与

# 第一次面试 #

1035688次浏览 13682人参与

# 今年秋招你收到了多少封邮件？ #

16995次浏览 217人参与

# 作业帮求职进展汇总 #

81670次浏览 529人参与

# 你今年的保底offer是哪家 #

154679次浏览 671人参与

# 携程求职进展汇总 #

838496次浏览 5508人参与

# 听到哪句话就代表面试稳了or挂了？ #

237272次浏览 1677人参与

# 毕业论文进行时 #

20603次浏览 129人参与

# 工作中遇到的歹人 #

25398次浏览 299人参与

# 找工作有哪些冷知识 #

204969次浏览 2603人参与

# 机械/制造每日一题 #

80098次浏览 1409人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务