关于filtered duplicate request的疑惑?-慕课网

3回答

bobby 2019-09-26 12:41:18

这种url明显不是一个url，指纹肯定不一样。如果说第一个访问后第二个不会访问了需要确保一下是不是第二个url已经访问过导致这个url的指纹会被放到缓存中

0 回复有任何疑惑可以回复我~

收起回答

提问者慕粉1946152704 #1
```
老师, 问题有修改, 请您过目?
```
回复有任何疑惑可以回复我~ 2019-09-26 19:25:11

qq_慕侠6486208 2021-04-27 10:07:33

请问你这个问题解决了吗？我也遇到了类似的问题，找不到解决的办法

0 回复有任何疑惑可以回复我~

收起回答

bobby #1

上面该同学提到的两个url不是说因为这两个url去重的，refer的意思是当前的url的前一个url是refer中的url，也就是当前的url是通过refer的url中点击过来的

回复有任何疑惑可以回复我~ 2021-04-27 22:10:59

bobby 2019-09-28 17:04:00

你试一下在每个request的参数中加上参数 dont_filter=False试试会不会被过滤掉

0 回复有任何疑惑可以回复我~

收起回答

提问者慕粉1946152704 #1

老师，代码中我用的是crawlspider，好像没有重写request的机会，而且request的dont_filter默认是false的

回复有任何疑惑可以回复我~ 2019-09-28 21:29:16

关于filtered duplicate request的疑惑?

正在回答

3回答

相似问题

请选择置顶位置

本课精华内容

Missing argument grant_type

MysqlTwistedPipline的对象没有cursor属性

知乎answer提取不到

为什么知乎数据导入不到MySQL数据库中？

运行 scrapy crawl jobbole 报错

【讨论题】你认为什么是 JS 逆向？

有没有方法可以比较准确的解析出 title 和正文内容

如何将数据的保存和抓取独立出来？

如何将 nodejs 服务集成进来呢？

【讨论题】字体反爬应该如何解析？

热搜

最近搜索清空

关于filtered duplicate request的疑惑?

正在回答

3回答

相似问题

请选择置顶位置

本课精华内容

Missing argument grant_type

MysqlTwistedPipline的对象没有cursor属性

知乎answer提取不到

为什么知乎数据导入不到MySQL数据库中？

运行 scrapy crawl jobbole 报错

【讨论题】你认为什么是 JS 逆向？

有没有方法可以比较准确的解析出 title 和正文内容

如何将数据的保存和抓取独立出来？

如何将 nodejs 服务集成进来呢？

【讨论题】字体反爬应该如何解析？