采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
老师,有一些跳转链接怎么抓取真实的跳转后的链接。
好比,http://www.smzdm.com/p/7158526/ 这个页面有个“直达链接”,它的地址为http://go.smzdm.com/2836fed0115cebae/ca_aa_yh_113_7158526_758_3161_4845
怎么抓取真实的跳转后的1药店的网址。
谢谢老师提供的这么好的教程。
谢谢对课程的支持, scrapy遇到301或者302会自动跳转 response回来的url就是跳转后的url, 如果不希望scrapy跳转可以直接在spider中设置handle_httpstatus_list = [404, 301, 302] 这种, 如果设置了scrapy就不会跳转了,应该可以通过response获取到301之后的跳转地址, 在scrapy的进阶中我有讲到这些知识点
非常感谢!
登录后可查看更多问答,登录/注册
带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎
5.5k 30
2.9k 18
1.6k 18
1.8k 15
3.4k 15
购课补贴联系客服咨询优惠详情
慕课网APP您的移动学习伙伴
扫描二维码关注慕课网微信公众号