Spark删除hive表后HDFS对应目录文件没有被删除-慕课网

1回答

Michael_PK 2020-07-22 18:15:21

有个问题要确认下，你spark代码写进去的表和beeline连都确定是同一个metastore数据吗，换句话说元数据是不是同一份

0 回复有任何疑惑可以回复我~

提问者某不入流码农 #1

是的，和视频一致，把hive-site.xml复制到spark里面的，然后代码是通过读取mysql表的数据，然后用saveAsTable写出的，并开启了hive支持，在代码里面show tables和beeline show tables内容也都是一致的

回复有任何疑惑可以回复我~ 2020-07-22 18:22:38

Michael_PK 回复提问者某不入流码农 #2

内部表是删除的时候元数据和数据都会被删掉，但是根据你的描述是没删掉。这样子，你按照这个顺序来测试下，不打包运行，直接sparkshell启动后把代码贴进去运行，然后运行完，还是在sparkshell里面执行spark.sql里面传入删表操作，最后到hdfs验证下。我当心你打包运行的时候是不是hivesite没打引起的，你可以按照我的步骤验证下

回复有任何疑惑可以回复我~ 2020-07-22 19:50:28

Spark删除hive表后HDFS对应目录文件没有被删除

正在回答回答被采纳积分+3

1回答

相似问题

请选择置顶位置

本课精华内容

提问老师client连接服务器出现的问题

7-3 kudu 部署失败

有HBase之后为什么还需要KUDU

问题：无法下载相关Spark和Scala依赖

kudu-master启动失败

【讨论题】简历项目问题

【讨论题】关于小文件的思考

【讨论题】关于数据倾斜的思考

【讨论题】关于Spark ThriftServer的HA问题

【讨论题】关于拉链表得思考

热搜

最近搜索清空