1. 第二种方式,SparkStreaming是如何从kafka里获取数据的,没太理解
官网解释是: this approach periodically queries Kafka for the latest offsets in each topic+partition, and accordingly defines the offset ranges to process in each batch.
是自己主动去kafka里周期性地取的意思吗?老师能稍微再解释下这第二种方式吗?
2. offset这个偏移量以及offset range偏移量的范围具体含义是什么,有点没听明白了,看了官网也没咋清楚,后面老师您又提到了消费的偏移量,那这么说offset应该是kafka里的,难道是指生产的馒头?是的话,那在具体业务场景里,这个偏移量又指的什么?