两个问题关于Direct方式-慕课网

1回答

Michael_PK 2017-11-10 15:40:04

是根据偏移量去kafka获取！偏移量就是kafka中已经被消费掉的一个记录。你可以搜索databricks官网，它有这个方式的详细介绍

0 回复有任何疑惑可以回复我~

提问者 Echo鑫 #1

那老师，
1. 如果第二种是根据偏移量去Kafka里获取数据，那第一种recevier的方式就是直接从kafka里获取数据吗？如果这样的话，这个recevier是不是就相当于是个消费者？
2. 这两种方式整合kafka，kafka和spark的启动顺序是不是不用像整合Flume那要区分开来，都是先启动kafka，再进行spark任务执行？

回复有任何疑惑可以回复我~ 2017-11-10 16:45:41

Michael_PK 回复提问者 Echo鑫 #2

第一种有reciever接收，第二种direct的没有receiver，然后从高可靠方面来说，direct靠谱

回复有任何疑惑可以回复我~ 2017-11-10 17:04:20

提问者 Echo鑫回复 Michael_PK #3

第一种是通过reciever直接获取kafka里的数据，相当于个消费者，而第二种是通过偏移量去kafka里获取数据，是这样吗？

回复有任何疑惑可以回复我~ 2017-11-10 17:47:58

点开查看后面2条评论

两个问题关于Direct方式

正在回答

1回答

相似问题

请选择置顶位置

本课精华内容

读英语的时候能不能不要propertie撕，topic撕

cannot assign requested address

kafka生产者消息发不出去

kafka.serializer.StringDecoder死活导不进来

spark streaming运行较长时间后报错kafka.common.OffsetOutOfRangeException

热搜

最近搜索清空