现在爬取知乎的时候 一开始时会出现很多429的状态码,然后不超过三分钟全部是403错误退出, 然后网页上刷新知乎会提示我流量异常,要输入验证码验证才能继续访问 , 有什么办法吗?谢谢老师!
[scrapy.core.engine] DEBUG: Crawled (429) <GET...........................
DEBUG: Crawled (403) <GET https://www.zhihu.com/api/v4/members/eli-85?include= ..........
[scrapy.spidermiddlewares.httperror] INFO: Ignoring response <403.........................
登录后可查看更多问答,登录/注册
带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎
了解课程