关于spark application的理解-慕课网

1回答

Michael_PK 回答被采纳获得+3积分 2021-04-22 17:06:10

这个理解不太对的，spark中的一个application就是一个driver和n个executor构成起来的，一个job对应的就是action算子触发产生的。这一个部分spark官网上有详细的spark术语介绍

0 回复有任何疑惑可以回复我~

提问者程研板 #1

就是说spark是预先创建好executor，不管有没有job，都会存在，相当于一直会开辟一块独立的资源区。而mapreduce，是提交一个job，创建进程，运行完后就销毁资源，下次提交job再申请资源，这样反复的比较耗时。

回复有任何疑惑可以回复我~ 2021-04-22 20:58:59

Michael_PK 回复提问者程研板 #2

你这个说法是对的，但是spark比如一个离线作业，他也是启动的时候去申请executor进程的资源的，然后task就跑在进程上。那么问题来了，你思考下，有什么版本能把spark作成一个服务不

回复有任何疑惑可以回复我~ 2021-04-23 16:29:09

提问者程研板回复 Michael_PK #3

spark的thrift server不就是个7*24小时开启的服务么。但是好像只支持sql的作业，df和ds的不行。

回复有任何疑惑可以回复我~ 2021-04-23 19:41:00

关于spark application的理解