老师好,我在分析scrapy的schedule源码中对于一段代码有疑惑,代码如下:
def enqueue_request(self, request):
"""
Request磁盘入队或者内存入队
:return: bool
"""
if not request.dont_filter and self.df.request_seen(request): # 如果指纹过滤器启动并且request已经被给予指纹 打印日志 等待先去重
self.df.log(request, self.spider)
return False
dqok = self._dqpush(request)
if dqok:
self.stats.inc_value('scheduler/enqueued/disk', spider=self.spider)
else:
self._mqpush(request)
self.stats.inc_value('scheduler/enqueued/memory', spider=self.spider)
self.stats.inc_value('scheduler/enqueued', spider=self.spider)
return True
我的问题是
带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎
了解课程