请稍等 ...

知乎首页-question链接提取问题

老师您好,请教一个问题：

图1您写的回调代码,实现起来好像不是很理想

图2是我发现的一个规律,当知乎首页右侧的下拉菜单拉到底后会自动加载出新的页面,抓包看到是通过post提交,当offset，start每次加10就会加载新的页面。

需求：是不是可以通过图2这种方式来多提取question链接,如果可以,是一个什么样的思路。

慕先生0421411 2017-05-02 15:17:24

源自：6-16 item loder方式提取question - 3

1925

收起

提交取消

3回答

bobby 回答被采纳获得+3积分 2017-05-03 09:38:41

亲你这个思路是没有问题的，因为考虑到课程的复杂性所以前面这部分我讲的比较简单，实际上后面selenium中有讲到关于如何模拟鼠标下拉，也可以获取更多的链接，在这一章中我会讲解到获取到answer，和你现在遇到的问题很类似，你可以参考一下本章后面的小节，大概意思就是在获取到所有的url之后，你自己去拼凑url然后yield request 回调函数写为parse就行了

0 回复有任何疑惑可以回复我~

收起回答

提问者慕先生0421411 #1
```
非常感谢！
```
回复有任何疑惑可以回复我~ 2017-05-10 23:06:59

提问者慕先生0421411 #2

请问老师在yield里面还需要加上什么参数才能成功请求到动态加载的页面？

回复有任何疑惑可以回复我~ 2017-05-24 19:51:38

bobby 2017-05-25 18:08:10

请求不了内容是什么意思？是没有进入parse函数吗，而且你这里写成了parsea，是拼写出错了吧

0 回复有任何疑惑可以回复我~

收起回答

提问者慕先生0421411 2017-05-24 19:50:47

请问老师在yield里面还需要加上什么参数才能成功请求到动态加载的页面？

0 回复有任何疑惑可以回复我~

收起回答

相似问题

学习爬取知乎首页所有question，发现提取网页源码的href解析出question的url是不能深度爬取全站所有question的url

知乎首页爬取出来的链接很少

知乎爬取问题

知乎question页面爬取

知乎访问用户信息的api获取数据时返回404

登录后可查看更多问答，登录/注册

Scrapy打造搜索引擎畅销4年的Python分布式爬虫课

参与学习 5831 人
解答问题 6293 个

带你彻底掌握Scrapy，用Django+Elasticsearch搭建搜索引擎

了解课程

本课精华内容

问答作业

Missing argument grant_type

5.7k 30

MysqlTwistedPipline的对象没有cursor属性

3.1k 18

知乎answer提取不到

1.8k 18

为什么知乎数据导入不到MySQL数据库中？

2.0k 15

运行 scrapy crawl jobbole 报错

3.6k 15

查看更多本课问答

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

知乎首页-question链接提取问题

正在回答

3回答

相似问题