采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
在用老师代码登录拉钩的时候自动302跳转到了登录界面,我想问下服务器判断爬虫是根据速度还是UA进行判断的啊?crawlspider的话应该怎么修改爬取速度和ua啊,因为和知乎的界面不太一样,不知道在源代码的哪里改,速度可以用TIMESLEEP ua我不会改啊
拉勾会通过ua和ip 都会做限制 反爬虫 不会只通过一种策略反爬虫, 随机ua的设置我会在后面的章节中介绍到 是全局的
非常感谢!
user-agent的改法老师的课程里讲过.
pip install fake-useragent,实例化一个ua,然后在headers里指定就好了
登录后可查看更多问答,登录/注册
带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎
5.3k 30
2.9k 18
1.5k 18
1.8k 15
3.4k 15
购课补贴联系客服咨询优惠详情
慕课网APP您的移动学习伙伴
扫描二维码关注慕课网微信公众号