请稍等 ...

关于request.seen文件清空的问题？

老师, scrapy-redis的课程中有提到一个schedule_flush_on_start变量可以控制这个指纹是否清空, 但是目前我不需要用分布式和redis,但是我又希望scrapy每次爬完数据后能保留request.seen文件，请问 scrapy本身有能控制爬虫程序结束后， request.seen文件清空的方法吗?

慕粉1946152704 2019-10-08 09:21:09

源自：15-1 es完成搜索建议-搜索建议字段保存 - 1

960

收起

提交取消

1回答

bobby 2019-10-09 11:25:14

你这个需求我不太明白，你提到希望爬完后保留seen文件，又需要清空文件的方法是什么意思？

0 回复有任何疑惑可以回复我~

收起回答

提问者慕粉1946152704 #1
```
就是爬完后保留seen文件的方法
```
回复有任何疑惑可以回复我~ 2019-10-11 07:46:22

bobby 回复提问者慕粉1946152704 #2

scrapy-redis会将所有已经访问过的url都保存在redis中，这个不满足你的需求吗？

回复有任何疑惑可以回复我~ 2019-10-14 08:57:05

提问者慕粉1946152704 回复 bobby #3
```
可以满足, 但是我更希望直接用scrapy实现这个功能.
```
回复有任何疑惑可以回复我~ 2019-10-14 14:07:20

点开查看后面1条评论

相似问题

为什么order里的OrderItems里的值被清空

关于头文件的问题请教一下老师

关于表空间的疑问

关于index.html消失的问题

关于happens-before的问题

登录后可查看更多问答，登录/注册

Scrapy打造搜索引擎畅销4年的Python分布式爬虫课

参与学习 5831 人
解答问题 6293 个

带你彻底掌握Scrapy，用Django+Elasticsearch搭建搜索引擎

了解课程

本课精华内容

问答作业

Missing argument grant_type

5.6k 30

MysqlTwistedPipline的对象没有cursor属性

3.0k 18

知乎answer提取不到

1.7k 18

为什么知乎数据导入不到MySQL数据库中？

1.9k 15

运行 scrapy crawl jobbole 报错

3.5k 15

查看更多本课问答

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

关于request.seen文件清空的问题？

正在回答回答被采纳积分+3

1回答

相似问题