请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

关于request.seen文件清空的问题?

老师, scrapy-redis的课程中有提到一个schedule_flush_on_start变量可以控制这个指纹是否清空, 但是目前我不需要用分布式和redis,但是我又希望scrapy每次爬完数据后能保留request.seen文件, 请问 scrapy本身有能控制爬虫程序结束后, request.seen文件清空的方法吗?

正在回答 回答被采纳积分+3

1回答

bobby 2019-10-09 11:25:14

你这个需求我不太明白,你提到希望爬完后保留seen文件,又需要清空文件的方法是什么意思?

0 回复 有任何疑惑可以回复我~
  • 提问者 慕粉1946152704 #1
    就是爬完后保留seen文件的方法
    回复 有任何疑惑可以回复我~ 2019-10-11 07:46:22
  • bobby 回复 提问者 慕粉1946152704 #2
    scrapy-redis会将所有已经访问过的url都保存在redis中,这个不满足你的需求吗?
    回复 有任何疑惑可以回复我~ 2019-10-14 08:57:05
  • 提问者 慕粉1946152704 回复 bobby #3
    可以满足, 但是我更希望直接用scrapy实现这个功能.
    回复 有任何疑惑可以回复我~ 2019-10-14 14:07:20
问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信