采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
老师,您好,我在实际开发中遇到一个问题,我在线上将比如多个分区的数据导入到了同一个文件里,我想把这些数据 load 到本地的 hive 库中,load 本身的语法好像只能指定一个 partition,有什么方法可以实现这种多分区数据在同一个文件然后一次性 load 到 hive 库的吗
load时可以指定分区的呢。你有多少个分区就手工指定下。load语法使用参见hive官网
我可能表述有点问题,不是多个字段的分区,是同个分区值。比如我的分区字段设置的是 date,但我的文件里存在 20190928、20190929、20190930 多个日期的数据,这时候想导入
那不行,load只能以文件为单位导入。如果你文件里面有多个值,那需要自己ETL后的结果再load
好的,明白了,谢谢老师
登录后可查看更多问答,登录/注册
从Hadoop核心技术入手,掌握数据处理中ETL应用,轻松进军大数据
1.3k 21
1.6k 20
1.4k 19
1.6k 17
3.3k 16