请稍等 ...

yarn提交任务模式，提示pyspark.zip找不到

/home/hadoop/app/spark-2.4.4-bin-hadoop2.7/bin/spark-submit --master yarn --name spark0402 ~/local_scripts/scripts/spark0402.py hdfs://node1:9000/hello.txt hdfs://node1:9000/output

报错信息主要是这样：
file:/home/hadoop/.sparkStaging/application_1575014477999_0002/pyspark.zip does not exist

19/12/03 05:14:10 INFO SparkContext: Successfully stopped SparkContext
Traceback (most recent call last):
  File "/home/hadoop/local_scripts/scripts/test.py", line 14, in <module>
    sc = SparkContext(conf=conf)
  File "/home/hadoop/app/spark-2.4.4-bin-hadoop2.7/python/lib/pyspark.zip/pyspark/context.py", line 136, in __init__
  File "/home/hadoop/app/spark-2.4.4-bin-hadoop2.7/python/lib/pyspark.zip/pyspark/context.py", line 198, in _do_init
  File "/home/hadoop/app/spark-2.4.4-bin-hadoop2.7/python/lib/pyspark.zip/pyspark/context.py", line 306, in _initialize_context
  File "/home/hadoop/app/spark-2.4.4-bin-hadoop2.7/python/lib/py4j-0.10.7-src.zip/py4j/java_gateway.py", line 1525, in __call__
  File "/home/hadoop/app/spark-2.4.4-bin-hadoop2.7/python/lib/py4j-0.10.7-src.zip/py4j/protocol.py", line 328, in get_return_value
py4j.protocol.Py4JJavaError: An error occurred while calling None.org.apache.spark.api.java.JavaSparkContext.
: org.apache.spark.SparkException: Application application_1575014477999_0002 failed 2 times due to AM Container for appattempt_1575014477999_0002_000002 exited with  exitCode: -1000
For more detailed output, check application tracking page:http://node1:8088/cluster/app/application_1575014477999_0002Then, click on links to logs of each attempt.
Diagnostics: File file:/home/hadoop/.sparkStaging/application_1575014477999_0002/pyspark.zip does not exist
java.io.FileNotFoundException: File file:/home/hadoop/.sparkStaging/application_1575014477999_0002/pyspark.zip does not exist

gyy_ 2019-12-04 11:15:37

源自：3-5 -RDD特性在源码中的体现

1640

收起

提交取消

1回答

Michael_PK 2019-12-04 11:42:01

你跑个wc案例，确保你的yarn是正常的，现在这日志，感觉你的yarn可能有问题

0 回复有任何疑惑可以回复我~

收起回答

提问者 gyy_ #1

我是这么解决的

conf = SparkConf().setMaster("yarn").set("spark.hadoop.fs.defaultFS", "hdfs://node1:9000")

要在代码里面显式的给出fs.defaultFS的配置

回复有任何疑惑可以回复我~ 2019-12-04 13:33:45

Michael_PK 回复提问者 gyy_ #2

这么解决是可以，但是代码写死了。我估计还是hadoop的配置有问题，导致有些参数找不到

回复有任何疑惑可以回复我~ 2019-12-04 14:48:08

相似问题

Spark On Yarn模式任务提交

Standalone模式下运行flink run和yarn模式冲突

如何用代码提交打包好的job到flink集群？

yarn跑普通的java任务

主队列异步串行问题

登录后可查看更多问答，登录/注册

Python3实战Spark大数据分析及调度

参与学习 1046 人
解答问题 434 个

使用Python3对Spark应用程序进行开发调优，掌握Azkaban任务调度

了解课程

本课精华内容

问答

老师，你用的mac电脑可以直接在上边进行开发测试，我们用的windows电脑，要如何导入spark，进行spark测试呢？

1.8k 16

Hadoop启动失败

1.5k 15

老师，能不能帮我看看，为啥我浏览器访问kibana是这样的

1.4k 14

Spark并行与资源分配的问题

1.5k 12

FAILED: SemanticException [Error 10001]: Line 1:28 Table not found 'emp'

2.8k 11

查看更多本课问答

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

yarn提交任务模式，提示pyspark.zip找不到

正在回答回答被采纳积分+3

1回答

相似问题

请选择置顶位置

本课精华内容

老师，你用的mac电脑可以直接在上边进行开发测试，我们用的windows电脑，要如何导入spark，进行spark测试呢？

Hadoop启动失败

老师，能不能帮我看看，为啥我浏览器访问kibana是这样的

Spark并行与资源分配的问题

FAILED: SemanticException [Error 10001]: Line 1:28 Table not found 'emp'

热搜

最近搜索清空

yarn提交任务模式，提示pyspark.zip找不到

正在回答 回答被采纳积分+3

1回答

相似问题

请选择置顶位置

本课精华内容

老师，你用的mac电脑可以直接在上边进行开发测试，我们用的windows电脑，要如何导入spark，进行spark测试呢？

Hadoop启动失败

老师，能不能帮我看看，为啥我浏览器访问kibana是这样的

Spark并行与资源分配的问题

FAILED: SemanticException [Error 10001]: Line 1:28 Table not found 'emp'

正在回答回答被采纳积分+3