采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
我在第6章的时候去跟着老师爬取拉勾网的职位,第一个没有加user-agent然后302重定向了,这是检测到是python吧,那它现在还有检测速度的反爬吗?它好像已经不需要登陆了吧?
很多网站都会检测user-agent, 如果遇到没有检测这个的说明这个网站可能对反爬不在意,因为这个是最基础的反爬了,拉钩网应该是对于自己的数据看的比较重,所以反爬上力度会大一些,爬取速度也是会检测的,所以需要控制一下抓取速度
老师,如果不停的爬取拉勾网的数据,大概到第2-3个的时候,他会让登陆验证,如果我不想登陆的话,那再下降速度重新爬取或者代理ip这样能不能绕过他的登陆验证?
只要是对方没有通过ip识别出来就行
登录后可查看更多问答,登录/注册
带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎
4.7k 30
2.5k 18
1.1k 18
1.3k 15
2.7k 15