请稍等 ...

Scrapy是不是会预读一次目标网站

目前看日志，没有进入实际爬取逻辑 parse（）内，就提示403，是不是框架会先请求一下要爬取的网站，然后就被墙了？

有的网站相同代理请求第二次就进反爬了，如果是这样的话，怎么屏蔽预请求？？

弗兰克的IT生活 2021-03-10 13:55:11

源自：10-4 scrapy-redis编写分布式爬虫代码

874

收起

提交取消

2回答

提问者弗兰克的IT生活 2021-03-10 14:10:22

[scrapy.core.engine] DEBUG: Crawled (200)

就是这行话，不知道怎么屏蔽掉

0 回复有任何疑惑可以回复我~

bobby #1
```
你爬取的是什么网站？
```
回复有任何疑惑可以回复我~ 2021-03-11 00:31:21
提问者弗兰克的IT生活回复 bobby #2
```
国外电商
```
回复有任何疑惑可以回复我~ 2021-03-11 09:55:49
提问者弗兰克的IT生活回复 bobby #3
```
scrapy.core.engine] DEBUG: Crawled (403)，这个是哪里出的？？
```
回复有任何疑惑可以回复我~ 2021-03-11 16:01:35

点开查看后面5条评论

提问者弗兰克的IT生活 2021-03-10 14:03:08

就是控制台显示，第一次200，第二次就403了～～～

0 回复有任何疑惑可以回复我~

相似问题

基于CrawlSpider，同一份代码爬取多个网站的数据，如果限制不爬取外链网站数据

B网站如何获取的A网站的cookies？？ xss 吗？

scrapy redis部署和scrapy的部署有什么不同？

innodb一次读多少页

url请求timeout时scrapy core会araise异常?

登录后可查看更多问答，登录/注册

Scrapy打造搜索引擎畅销4年的Python分布式爬虫课

参与学习 5831 人
解答问题 6293 个

带你彻底掌握Scrapy，用Django+Elasticsearch搭建搜索引擎

了解课程

本课精华内容

问答作业

Missing argument grant_type

5.8k 30

MysqlTwistedPipline的对象没有cursor属性

3.1k 18

知乎answer提取不到

1.8k 18

为什么知乎数据导入不到MySQL数据库中？

2.0k 15

运行 scrapy crawl jobbole 报错

3.6k 15

查看更多本课问答

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

扫描二维码
关注慕课网微信公众号