老师，用scrapy-redis怎么实现深度优先啊-慕课网

2回答

bobby 2017-05-05 14:13:31

调试会麻烦？目前主要麻烦的地方是哪里？和普通的debug是一样的啊

0 回复有任何疑惑可以回复我~

收起回答

提问者慕粉1724417796 2017-05-24 09:05:46

比如说Rule有很多条，但是有callback是最后一条也是详细页，会等所有满足callback的那条Ruel的url全部加入redis队列中，才会执行callback那条Rule

这就会出现这种：redis中都几百万条request了，但没有一条执行callback

rules = (
Rule(LinkExtractor(allow=r'11467\.com/\w+?/$')),
Rule(LinkExtractor(allow=r'11467\.com/.*')),
Rule(LinkExtractor(allow=r'11467\.com/\w+?/co/\d+\.htm$'), callback='parse_detail', follow=True),
)

有没有办法设定Rule的优先级，让特定Rule优先处理，比如最后一条有callback的rule

0 回复有任何疑惑可以回复我~

收起回答

bobby #1

scrapy-redis中默认使用的是优先队列， 你可以在放request的时候指定一下优先级让某些url放到队列的头部， 课程中已经讲过源码了 应该知道如何设置优先级吧

回复有任何疑惑可以回复我~ 2017-05-24 17:35:14

10codes15bugs 回复 bobby #2

老师  这种情况是正常的吗？？ 不是应该边爬边提取码？
比如说Rule有很多条，但是有callback是最后一条也是详细页，会等所有满足callback的那条Ruel的url全部加入redis队列中，才会执行callback那条Rule

这就会出现这种：redis中都几百万条request了，但没有一条执行callback

回复有任何疑惑可以回复我~ 2019-10-14 17:35:37

10codes15bugs #3

不是应该一边把request输入到redis队列中一边把request提出来解析吗？为什么要等request全部放到队列中才开始解析request？

回复有任何疑惑可以回复我~ 2019-10-14 17:37:07

点开查看后面1条评论

老师，用scrapy-redis怎么实现深度优先啊

正在回答回答被采纳积分+3

2回答

相似问题

请选择置顶位置

本课精华内容

Missing argument grant_type

MysqlTwistedPipline的对象没有cursor属性

知乎answer提取不到

为什么知乎数据导入不到MySQL数据库中？

运行 scrapy crawl jobbole 报错

【讨论题】你认为什么是 JS 逆向？

有没有方法可以比较准确的解析出 title 和正文内容

如何将数据的保存和抓取独立出来？

如何将 nodejs 服务集成进来呢？

【讨论题】字体反爬应该如何解析？

热搜

最近搜索清空