关于批量插入作业-慕课网

1回答

Michael_PK 回答被采纳获得+3积分 2020-02-12 14:00:52

单位看字面意思应该是字节，你这么操作理论上应该可以，直接使用外部数据源的方式好像也有参数可以控制

0 回复有任何疑惑可以回复我~

提问者慕移动6222658 #1
```
谢谢老师，我再研究研究
```
回复有任何疑惑可以回复我~ 2020-02-12 14:15:33

慕少7351152 #2

老师，这个思考题我尝试理解一下。。您是想问生产中我有某个特定的数据源，然后怎么写代码让他批量从数据源写入吗？
如果是这样，我看网上可以用spark将数据源读成df然后写入kudu
https://www.oreilly.com/content/how-can-i-bulk-load-data-from-hdfs-to-kudu-using-apache-spark/

回复有任何疑惑可以回复我~ 2022-06-25 15:31:04

Michael_PK 回复慕少7351152 #3

spark批量写入的话，可以到社区上找下是否有sparksql对接的kudu的外部数据源，直接通过外部数据源写入就可以

回复有任何疑惑可以回复我~ 2022-06-27 00:10:47

关于批量插入作业

正在回答

1回答

相似问题

请选择置顶位置

本课精华内容

提问老师client连接服务器出现的问题

7-3 kudu 部署失败

有HBase之后为什么还需要KUDU

问题：无法下载相关Spark和Scala依赖

kudu-master启动失败

【讨论题】简历项目问题

【讨论题】关于小文件的思考

【讨论题】关于数据倾斜的思考

【讨论题】关于Spark ThriftServer的HA问题

【讨论题】关于拉链表得思考

热搜

最近搜索清空