请稍等 ...

跳转链接怎么抓取

老师，有一些跳转链接怎么抓取真实的跳转后的链接。

好比，http://www.smzdm.com/p/7158526/ 这个页面有个“直达链接”，它的地址为http://go.smzdm.com/2836fed0115cebae/ca_aa_yh_113_7158526_758_3161_4845

怎么抓取真实的跳转后的1药店的网址。

谢谢老师提供的这么好的教程。

sofeng 2017-04-19 17:08:17

源自：7-6 item loader方式解析职位

1712

收起

提交取消

1回答

bobby 2017-04-20 15:43:58

谢谢对课程的支持， scrapy遇到301或者302会自动跳转 response回来的url就是跳转后的url，如果不希望scrapy跳转可以直接在spider中设置handle_httpstatus_list = [404, 301, 302] 这种，如果设置了scrapy就不会跳转了，应该可以通过response获取到301之后的跳转地址，在scrapy的进阶中我有讲到这些知识点

0 回复有任何疑惑可以回复我~

提问者 sofeng #1
```
非常感谢！
```
回复有任何疑惑可以回复我~ 2017-04-23 08:30:04

相似问题

客户端链接跳转

微信链接跳转

sell.com跳转问题

到底怎么才能跳到订单详情页

老师比如我想动态获取美团美食的数据动态抓取到网页之后还怎么处理呢

登录后可查看更多问答，登录/注册

Scrapy打造搜索引擎畅销4年的Python分布式爬虫课

参与学习 5831 人
解答问题 6293 个

带你彻底掌握Scrapy，用Django+Elasticsearch搭建搜索引擎

了解课程

本课精华内容

问答作业

Missing argument grant_type

5.7k 30

MysqlTwistedPipline的对象没有cursor属性

3.0k 18

知乎answer提取不到

1.7k 18

为什么知乎数据导入不到MySQL数据库中？

1.9k 15

运行 scrapy crawl jobbole 报错

3.5k 15

查看更多本课问答

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

扫描二维码
关注慕课网微信公众号