请稍等 ...

spark集群运行错误

package com.wsx.spark

import org.apache.spark.{SparkConf, SparkContext}

object SparkTest {

  val SPARK_URL = "spark://192.168.72.132:7077"
  val HADOOP_URI = "hdfs://192.168.72.132:9000"
  val FILE_PATH = "/input/wc.input"
  val OUTPUT = "output"

  def main(args: Array[String]): Unit = {
    val conf = new SparkConf().setAppName("SparkHomework").setMaster(SPARK_URL)
    conf.setJars(Seq("C:\\Users\\wusx\\Desktop\\wsx\\Code\\review\\hadoop-train\\target\\hadoop-train-1.0.jar"))

    val sc = new SparkContext(conf)
    println(sc)
    println(HADOOP_URI + FILE_PATH)

    val counts = sc.textFile(HADOOP_URI+FILE_PATH).flatMap(line => line.split(","))
      .foreach(println)
//      .map(x => (x, 1))
//      .reduceByKey((x, y) => x + y)
    //    判断文件是否已经存在
    //    val file = new File(OUTPUT)
    //    if(file.exists) {
    //      file.delete()
    //    }
//    counts.foreach(println)

    sc.stop()

  }

}

错误：

Exception in thread "main" org.apache.spark.SparkException: Job aborted due to stage failure: Task 0 in stage 0.0 failed 4 times, most recent failure: Lost task 0.3 in stage 0.0 (TID 6) (192.168.72.134 executor 2): java.lang.ClassCastException: cannot assign instance of java.lang.invoke.SerializedLambda to field org.apache.spark.rdd.MapPartitionsRDD.f of type scala.Function3 in instance of org.apache.spark.rdd.MapPartitionsRDD

Caused by: java.lang.ClassCastException: cannot assign instance of java.lang.invoke.SerializedLambda to field org.apache.spark.rdd.MapPartitionsRDD.f of type scala.Function3 in instance of org.apache.spark.rdd.MapPartitionsRDD

老师请问这个问题怎么解决啊？

慕容3565349 2022-07-03 12:03:05

源自：2-13 使用IDEA和Maven开发第一个Spark应用程序

751

收起

提交取消

1回答

Michael_PK 2022-07-04 00:27:37

强烈建议：写代码的时候不要连到比如standalone或者yarn上去，而是直接使用local模式。

测试通过后，打包再提交到不同的运行模式上去。

你按照上课的方式先把代码测试通过，看看有什么异常贴出来

0 回复有任何疑惑可以回复我~

收起回答

提问者慕容3565349 #1
```
local模式可以运行的
```
回复有任何疑惑可以回复我~ 2022-07-05 21:11:54

Michael_PK 回复提问者慕容3565349 #2

代码里面不要带任何硬编码，比如master啥的，全部在sparksubmit提交的时候指定

回复有任何疑惑可以回复我~ 2022-07-07 15:56:05

相似问题

关于Spark运行模式：YARN

spark 分布式计算

spark源码编译错误

spark spark

运行spark-shell的时候报错

登录后可查看更多问答，登录/注册

SparkSQL入门整合Kudu实现广告业务数据分析

参与学习 542 人
解答问题 192 个

大数据工程师干货课程带你从入门到实战掌握SparkSQL

了解课程

本课精华内容

问答作业

提问老师client连接服务器出现的问题

1.4k 15

7-3 kudu 部署失败

1.4k 14

有HBase之后为什么还需要KUDU

1.7k 12

问题：无法下载相关Spark和Scala依赖

2.2k 12

kudu-master启动失败

1.6k 11

查看更多本课问答

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

spark集群运行错误

正在回答回答被采纳积分+3

1回答

相似问题

请选择置顶位置

本课精华内容

提问老师client连接服务器出现的问题

7-3 kudu 部署失败

有HBase之后为什么还需要KUDU

问题：无法下载相关Spark和Scala依赖

kudu-master启动失败

【讨论题】简历项目问题

【讨论题】关于小文件的思考

【讨论题】关于数据倾斜的思考

【讨论题】关于Spark ThriftServer的HA问题

【讨论题】关于拉链表得思考

热搜

最近搜索清空

spark集群运行错误

正在回答 回答被采纳积分+3

1回答

相似问题

请选择置顶位置

本课精华内容

提问老师client连接服务器出现的问题

7-3 kudu 部署失败

有HBase之后为什么还需要KUDU

问题：无法下载相关Spark和Scala依赖

kudu-master启动失败

【讨论题】简历项目问题

【讨论题】关于小文件的思考

【讨论题】关于数据倾斜的思考

【讨论题】关于Spark ThriftServer的HA问题

【讨论题】关于拉链表得思考

正在回答回答被采纳积分+3