请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

跳转链接怎么抓取

老师,有一些跳转链接怎么抓取真实的跳转后的链接。

好比,http://www.smzdm.com/p/7158526/ 这个页面有个“直达链接”,它的地址为http://go.smzdm.com/2836fed0115cebae/ca_aa_yh_113_7158526_758_3161_4845

怎么抓取真实的跳转后的1药店的网址。

谢谢老师提供的这么好的教程。

正在回答

1回答

bobby 2017-04-20 15:43:58

谢谢对课程的支持, scrapy遇到301或者302会自动跳转 response回来的url就是跳转后的url, 如果不希望scrapy跳转可以直接在spider中设置handle_httpstatus_list = [404, 301, 302] 这种, 如果设置了scrapy就不会跳转了,应该可以通过response获取到301之后的跳转地址, 在scrapy的进阶中我有讲到这些知识点

0 回复 有任何疑惑可以回复我~
  • 提问者 sofeng #1
    非常感谢!
    回复 有任何疑惑可以回复我~ 2017-04-23 08:30:04
问题已解决,确定采纳
还有疑问,暂不采纳
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号