采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
增量抓取可以使用scrapy-redis定时向redis的队列中放入待抓取的requests 并把队列设置为优先级队列就可以控制哪些request会优先抓取了
那么如何判断哪些requests是待抓取的呢?
你把Request中设置一个参数dont_filter设置为True,但是哪些需要重新抓取这个需要你自己去设置了
登录后可查看更多问答,登录/注册
带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎
4.7k 30
2.5k 18
1.1k 18
1.3k 15
2.7k 15