请稍等 ...

知乎爬取问题

为什么一开始显示的只有11个有关question的问题url，但是一旦run起来了就有很多很多question的url,

然后我就下拉知乎首页经过ajax请求后又会多出一些知乎的问题，但是抓不到ajax的包

所以就不明白程序是怎么样在一开始只有11question的url的情况下可以不断地爬取更多的url(但是最后大概爬取了50，60个就停止）应该是不会停止的呀？

qq_Fluorescent_0 2017-10-14 17:09:52

源自：6-18 知乎spider爬虫逻辑的实现以及answer的提取 - 2

2155

收起

提交取消

2回答

提问者 qq_Fluorescent_0 2017-10-17 12:36:18

谢谢老师这么耐心

0 回复有任何疑惑可以回复我~

收起回答

bobby 2017-10-16 10:42:20

亲后面我会讲如何通过浏览器去爬取到时候你可以通过浏览器滚动条下拉的方式去获取更多的question 这个在后面的动态网页爬取章节中都会讲到的

0 回复有任何疑惑可以回复我~

收起回答

提问者 qq_Fluorescent_0 #1
```
好的谢谢老师 
```
回复有任何疑惑可以回复我~ 2017-10-16 20:12:04

提问者 qq_Fluorescent_0 #2

可是我还是不明白 第一次他只抓取了11个url 到最后竟然爬取了50 60个url

回复有任何疑惑可以回复我~ 2017-10-16 20:13:07

bobby 回复提问者 qq_Fluorescent_0 #3

这个就是看爬虫中你的提取方法了 如果你在详情页中也提取其他question的话  就不止11个了

回复有任何疑惑可以回复我~ 2017-10-17 10:15:11

相似问题

爬取拉钩要登录

用scrapy-redis爬知乎报错

对于知乎爬虫逻辑的问题

学习爬取知乎首页所有question，发现提取网页源码的href解析出question的url是不能深度爬取全站所有question的url

知乎首页爬取出来的链接很少

登录后可查看更多问答，登录/注册

Scrapy打造搜索引擎畅销4年的Python分布式爬虫课

参与学习 5831 人
解答问题 6293 个

带你彻底掌握Scrapy，用Django+Elasticsearch搭建搜索引擎

了解课程

本课精华内容

问答作业

Missing argument grant_type

5.7k 30

MysqlTwistedPipline的对象没有cursor属性

3.1k 18

知乎answer提取不到

1.8k 18

为什么知乎数据导入不到MySQL数据库中？

2.0k 15

运行 scrapy crawl jobbole 报错

3.6k 15

查看更多本课问答

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

知乎爬取问题

正在回答回答被采纳积分+3

2回答

相似问题