请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

crwalspider会跳转到登陆界面

老师,我的爬取它会自动跳转到登陆界面,是不是因为提取网址的时候进入到了登陆的网址,或是其他的什么原因?

正在回答

1回答

bobby 2017-06-07 17:11:02

这个应该是服务器某些页面只有登录才有访问权限 或者判断你为爬虫 让你重新登录验证, 爬取的时候使用ip代理 或者动态切换user agent 以及注意下一下爬取速度, 这些技术后面都会讲到的

2 回复 有任何疑惑可以回复我~
  • 提问者 傻宝3 #1
    老师,那我想写个登陆程序加在crawlspider里面,但不知道该写在什么地方。能不能在提取了连接后再加入登陆程序呢?但是感觉这样逻辑也不通顺…
    回复 有任何疑惑可以回复我~ 2017-06-07 17:45:57
  • 就是现在没办法跟着你敲代码了
    回复 有任何疑惑可以回复我~ 2017-06-07 20:20:02
  • bobby 回复 提问者 傻宝3 #3
    在后面章节中介绍的downloadmiddleware中可以在process_response中添加判断是否被跳转了 如果是就模拟登录 然后参考默认的cookie的middleware将cookie加入到scrapy中去
    回复 有任何疑惑可以回复我~ 2017-06-08 09:42:20
问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信