老师,我遇到一个网站,把start_urls输进去,就直接503
DEBUG: Retrying <GET http://www.cehui8.com> (failed 1 times): 503 Service Unavailable
RandomUserAgent也设置了,还设置了一堆这种属性
"AUTOTHROTTLE_ENABLED": True,
"AUTOTHROTTLE_START_DELAY": 5,
"AUTOTHROTTLE_MAX_DELAY": 60,
"CONCURRENT_REQUESTS_PER_DOMAIN": 1,
"ONCURRENT_REQUESTS": 1
还是不行。。怎么办?
这个网站用正常的浏览器打开,也会出现一个页面显示“浏览器安全检查中”,之后才会跳转到要访问的页面
用scrapy shell随便访问网站下的一个页面,也是503。
您帮我试试?多谢
带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎
了解课程