请稍等 ...

crwalspider会跳转到登陆界面

老师，我的爬取它会自动跳转到登陆界面，是不是因为提取网址的时候进入到了登陆的网址，或是其他的什么原因？

傻宝3 2017-06-06 15:45:02

源自：7-8 职位信息入库-2

1179

收起

提交取消

1回答

bobby 2017-06-07 17:11:02

这个应该是服务器某些页面只有登录才有访问权限或者判断你为爬虫让你重新登录验证，爬取的时候使用ip代理或者动态切换user agent 以及注意下一下爬取速度，这些技术后面都会讲到的

2 回复有任何疑惑可以回复我~

提问者傻宝3 #1

老师，那我想写个登陆程序加在crawlspider里面，但不知道该写在什么地方。能不能在提取了连接后再加入登陆程序呢？但是感觉这样逻辑也不通顺…

回复有任何疑惑可以回复我~ 2017-06-07 17:45:57

慕的地7986880 #2
```
就是现在没办法跟着你敲代码了
```
回复有任何疑惑可以回复我~ 2017-06-07 20:20:02

bobby 回复提问者傻宝3 #3

在后面章节中介绍的downloadmiddleware中可以在process_response中添加判断是否被跳转了 如果是就模拟登录 然后参考默认的cookie的middleware将cookie加入到scrapy中去

回复有任何疑惑可以回复我~ 2017-06-08 09:42:20

点开查看后面1条评论

相似问题

老师，我这个登陆成功后不会跳转回/hello，再访问/hello还是让我登录。这是什么原因呢？

我注释掉校验验证码的代码！登陆也没有任何提示！！感觉登陆就做了个页面刷新！

老师，登录跳转不到首页，注册我不行，注册成功，也不会跳转到登录页

设置了浏览器的cookie保存时间，main那里也没做拦截，但是刷新页面不自动跳登录页面

设置了session有效期，过期后默认跳转界面怎么设置

登录后可查看更多问答，登录/注册

Scrapy打造搜索引擎畅销4年的Python分布式爬虫课

参与学习 5831 人
解答问题 6293 个

带你彻底掌握Scrapy，用Django+Elasticsearch搭建搜索引擎

了解课程

本课精华内容

问答作业

Missing argument grant_type

5.7k 30

MysqlTwistedPipline的对象没有cursor属性

3.1k 18

知乎answer提取不到

1.8k 18

为什么知乎数据导入不到MySQL数据库中？

2.0k 15

运行 scrapy crawl jobbole 报错

3.6k 15

查看更多本课问答

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

扫描二维码
关注慕课网微信公众号