采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
有规律的,每爬取一段数据,就会出现302,
这是被拉勾网判定为爬虫了, 判定一个网站是判定你为爬虫的规则各个网站是不同的, 而且是不会告诉外界的, 只有自己去不停的试错 来判断比如请求频率是多少, 比如一个网站可能会根据每分钟, 每小时, 每天的请求次数来判定你为爬虫, 你只有不停的去猜测这个边界到底是多少
该怎么办了?
限制爬虫速度 使用ip代理访问 禁用cookie 三种方法结合使用
登录后可查看更多问答,登录/注册
带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎
4.9k 30
2.6k 18
1.3k 18
1.5k 15
3.0k 15
购课补贴联系客服咨询优惠详情
慕课网APP您的移动学习伙伴
扫描二维码关注慕课网微信公众号