01-13 15:51 已编辑大数据开发工程师发布于上海

关注

pyspark中 job执行的流程

一个 spark-submit 提交的应用程序（Application）会触发多少个Job，完全取决于你的代码中包含了多少个 Action 操作。

下面我们来详细分解这个概念：

📊 核心概念：Action触发Job

在Spark的执行模型中，这是一个铁律：

转换（Transformation）：如 map、filter、join，它们只定义计算逻辑，是“惰性”的，不会立即执行。
动作（Action）：如 count()、collect()、saveAsTextFile()、show()，它们会触发一个作业（Job）的真正执行，目的是产出结果或输出。

每个Action触发一个独立的Job。 因此，你的代码里有几个Action，spark-submit 运行这个应用时就会生成几个Job。

首先Driver程序会解析我们的代码，形成RDD的计算图。

接着，DAGScheduler会根据宽依赖将计算图划分成不同的Stage，每个Stage内部是一系列可以并行执行的Task。

然后，TaskScheduler会与Cluster Manager协作，申请资源启动Executor，并将Task分发到各个Executor上执行。Executor执行Task，并将状态和结果返回给Driver。

整个过程，Shuffle是Stage划分和数据交换的关键点，也是主要的性能优化切入点。

全部评论

推荐最新楼层

哞客374226558号

数字马力（长沙）信息技术有限公司_后端开发

不明觉厉

点赞回复分享

发布于 01-14 18:29 陕西

02-02 10:47

文远知行_感知算法工程师(准入职员工)

文远知行内推，文远知行内推码

恍恍惚惚也实习快半年了，工作主要是后端开发。 进了才知道是自动驾驶头部的明星初创（不是的话别打我🫣）。每天从家走路15min/骑车5min到公司属实很爽。 整体规模不大，工作内容还是很丰富。从python后端到java后端，中间又穿插了一个月前端开发（噩梦hhh），以后很可能还会涉及scala。长远来看，应该还是java和scala为主，go也有使用但是不清楚我会不会用上。 我本身是第一段开发实习，加上底子很弱，确实学到很多也成长很多。被分到各种任务有时候还是蛮慌张的，好在结果整体还ok！ 不提倡狂加班，还是以结果为导向，干完就可以溜溜球。加上通勤很少，整体强度不算很大。组内氛围也是挺不错的...

文远知行公司福利 558人发布

点赞评论收藏

昨天 11:25

桂林电子科技大学前端工程师

27前端想找实习

有无佬帮小弟看看简历能怎么优化一下，现在在学react和背八股面经，有点焦头烂额了，想在三月份前找到一个实习的话还要包装简历吗？目前在github上找了一个开源的中大型vue3+Ts的项目研究，但是感觉好困难啊，还是说在b站上找视频继续跟着敲代码会好点？或者说技术栈还有什么急需要补充的吗？

程序员找工作至少要刷多少...

点赞评论收藏

2025-12-12 19:58

哔哩哔哩_产品运营

白月光阿B请继续保持

跟同事聊天时候，同事说“你刚来时候blabla”，突然意识到自己已经正式工作一年多了！就这么从脆皮内耗大学生逐渐磨练成厚血条（厚脸皮）工位主理人。秋招简历当然也是投了不少份，但总有一些机会要留给自己的白月光，比如阿B，说说我秋招选择阿B的理由吧：1. “为爱发电”：说来兴趣真的是初心，阿B在手机陪我看了那么多番剧vlog学习视频，当然想和它距离更近一些。来了之后发现，B站重要活动要专门走内宣是有原因的，身边的六级大佬绝对不在少数。2. 实习体验感拉满：嗯对其实等不到正式工作就先来实习体验了。实习期在一个非常好的组，大家都很年轻氛围超好，做事情讲背景、讲逻辑不会只丢脏活累活。平时聊得来，工作起来也能快速打配合，项目完成时候所有人都成就感满满。再说说来正式工作之后的体验感：1. 校招生mentor文化很需要：在阿B每个校招生入职都是会有一位mentor的，不会让大家有刚工作人生地不熟就孤苦一人挑大梁的感觉。很幸运我的mt人真的超好，耐心温柔业务能力又很强。常常在对需求听她帮我说话时看着她身上闪耀的光芒想要流泪。有mt的话landing期会顺畅很多。公司也会安排一些活动帮助mentor和mentee增进感情。2.小动物们和各类活动是回血剂：工作起来当然难免遇到一些磕磕磨磨，但是压力大时候转头看到想悄悄溜过的小猫摸上一把，真的会治愈不少。还有节假日的各种活动和扫楼活动，真的会给上班增加动力。最后上图！没有任何工作会让人一直开心吧，但阿B你在照顾员工心情这一块儿做得真的很不错。

哔哩哔哩公司福利 915人发布

点赞评论收藏

01-12 20:31

东北大学 Java

27届末9本简历不过

牛爷爷们，boss投递简历了20+了，只有字节给面了（处女面估计过不了😫），是项目有问题吗，还是不应当写上游戏服务器的项目，换项目有什么推荐的方向吗，如果要写项目的数据，面试官都会问哪些问题呀

冰炸橙汁_不做oj版：虽然石凯说这大作业能用但是我感觉走java后端还是算了吧，项目一般放两个就行，建议到知识星球上找个项目把前两个换掉

点赞评论收藏

02-02 10:47

禾赛科技_嵌入式软件工程师(准入职员工)

禾赛科技内推，禾赛科技内推码

禾赛科技 嵌入式开发（操作系统）面经⚜技术是真的过硬啊，秋招嵌入式被拷打的最狠之一。原定45分钟，拷打一个半小时，涉及知识面特别广，实际问的比这还要多，记忆有限。不过也无后续，但也没挂，估计在L3缓存里面吧⭕一面（9.18）1. 自我介绍2. 项目介绍3. 有没有测量IMU精度4. 串口有几根线，中断配置？5. IIC有几根线？讲一讲怎么通信？详细说一下读取寄存器的流程6. 说一说任务有哪几种状态？就绪和阻塞的任务放在哪里？放在同一个链表上面吗？7. 任务怎么进入阻塞态？（主动挂起，被强占，争取不到资源等）8. 说一说死锁？9. 怎么解决死锁问题？（获取不到锁的时候，释放本身的资源）10. 有...

点赞评论收藏

全站热榜

创作者周榜

正在热议

# 为了减少AI幻觉，你注入过哪些设定？ #

# 关于春招/暑期实习，你想知道哪些信息？ #

# 从哪些方向判断这个offer值不值得去？ #

51093次浏览 348人参与