请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

爬取lagou时报错无法获取内容

https://img1.sycdn.imooc.com/szimg//59590e3d0001ebba05740242.jpg显示重定向,有2个问题 -

1. 是不是被禁爬虫了?该如何解封?

2. 另外再问下,用crawl模板生成的任务中,如何加入header?

正在回答 回答被采纳积分+3

1回答

bobby 2017-07-03 14:24:55

重启家里的路由器 然后ip就会变 直接在yield request(headers=header)

0 回复 有任何疑惑可以回复我~
  • 提问者 williamg #1
    还是不行,我加了header,加了代理,但出来的还是同样的情况 -
    2017-07-09 11:00:02 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.lagou.com/zhaopin/shenduxuexi/> (referer: https://www.lagou.com/)
    2017-07-09 11:00:02 [scrapy.dupefilters] DEBUG: Filtered duplicate request: <GET https://www.lagou.com/zhaopin/jiqixuexi/> - no more duplicates will be shown (see DUPEFILTER_DEBUG to show all duplicates)
    2017-07-09 11:00:02 [scrapy.downloadermiddlewares.redirect] DEBUG: Redirecting (302) to <GET https://passport.lagou.com/login/login.html?msg=validation&uStatus=2&clientIp=112.195.97.53> from <GET https://www.lagou.com/zhaopin/jingzhuntuijian/>
    2017-07-09 11:00:03 [scrapy.downloadermiddlewares.redirect] DEBUG: Redirecting (302) to <GET https://passport.lagou.com/login/login.html?msg=validation&uStatus=2&clientIp=112.195.97.53> from <GET https://www.lagou.com/zhaopin/sousuosuanfa/>
    2017-07-09 11:00:03 [scrapy.downloadermiddlewares.redirect] DEBUG: Redirecting (302) to <GET https://passport.lagou.com/login/login.html?msg=validation&uStatus=2&clientIp=112.195.97.53> from <GET https://www.lagou.com/zhaopin/iOS/>
    回复 有任何疑惑可以回复我~ 2017-07-09 11:01:30
  • bobby 回复 提问者 williamg #2
    你加我的qq 442421039 我看看
    回复 有任何疑惑可以回复我~ 2017-07-10 09:52:35
问题已解决,确定采纳
还有疑问,暂不采纳
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号