采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
老师我用sparkstreaming读topic数据保存到hdfs上的格式是parquet,我是这样去做的,但是我试了好多次是不对的
你直接spark.read.parquet(path) 然后有一个方法 能直接获得到 这个path下的文件对应的整个structtype信息
我现在是从topic再往hdfs上保存,要求有parquet文件的scheme定义
登录后可查看更多问答,登录/注册
Flume+Kafka+Spark Streaming 构建通用实时流处理平台
1.7k 89
1.1k 14
2.3k 13
1.7k 12
2.4k 12