请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

Scrapy是不是会预读一次目标网站

目前看日志,没有进入实际爬取逻辑 parse()内,就提示403,是不是框架会先请求一下要爬取的网站,然后就被墙了?

有的网站相同代理请求第二次就进反爬了,如果是这样的话,怎么屏蔽预请求??

正在回答 回答被采纳积分+3

2回答

提问者 弗兰克的IT生活 2021-03-10 14:10:22

[scrapy.core.engine] DEBUG: Crawled (200)

就是这行话,不知道怎么屏蔽掉

0 回复 有任何疑惑可以回复我~
  • bobby #1
    你爬取的是什么网站?
    回复 有任何疑惑可以回复我~ 2021-03-11 00:31:21
  • 提问者 弗兰克的IT生活 回复 bobby #2
    国外电商
    回复 有任何疑惑可以回复我~ 2021-03-11 09:55:49
  • 提问者 弗兰克的IT生活 回复 bobby #3
    scrapy.core.engine] DEBUG: Crawled (403),这个是哪里出的??
    回复 有任何疑惑可以回复我~ 2021-03-11 16:01:35
提问者 弗兰克的IT生活 2021-03-10 14:03:08

就是控制台显示,第一次200,第二次就403了~~~

0 回复 有任何疑惑可以回复我~
问题已解决,确定采纳
还有疑问,暂不采纳
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号