采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
老师 爬取了一堆代理,刚刚开始都可以用,但是用多了有的代理就被block了。 譬如用A代理请求的这个URL,但是A代理用久了被封了,scrapy会不会重新用能用其他的代理去请求?还是这个请求失败的url就放弃了吗? 有时候代理用久了被block掉,但是自己也查不到,还是让scrapy一直在跑。 有没有什么好的方法可以解决吗?
现在的免费代理因为使用的人实在太多了 很不稳定,之前有个学员用过一个收费代理说的很不错 你可以看看 https://www.abuyun.com/
我现在也是用收费了,就是想知道,我用这个代理发起的request的url,如果这个代理刚好被封了,那发起的这个url是就被scrapy放弃掉,还是scrapy会用新的ip继续尝试发起request呢?
scrapy有一个retry的middleware 对于某些失败的会再次发起,对于最终失败的你可以用middlware拦截然后再次自己发起请求 如果再次发起的话 就又会走你的修改ip代理的逻辑的
登录后可查看更多问答,登录/注册
带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎
4.8k 30
2.6k 18
1.1k 18
1.4k 15
2.8k 15