采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
为什么一开始显示的只有11个有关question的问题url,但是一旦run起来了 就有很多很多question的url,
然后我就下拉知乎首页 经过ajax请求后又会多出一些知乎的问题,但是抓不到ajax的包
所以就不明白程序是怎么样在一开始只有11question的url的情况下可以不断地爬取更多的url(但是最后大概爬取了50,60个就停止) 应该是不会停止的呀?
谢谢老师这么耐心
亲 后面我会讲如何通过浏览器去爬取 到时候你可以通过浏览器滚动条下拉的方式去获取更多的question 这个在后面的动态网页爬取章节中都会讲到的
好的谢谢老师
可是我还是不明白 第一次他只抓取了11个url 到最后竟然爬取了50 60个url
这个就是看爬虫中你的提取方法了 如果你在详情页中也提取其他question的话 就不止11个了
登录后可查看更多问答,登录/注册
带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎
4.7k 30
2.5k 18
1.1k 18
1.3k 15
2.7k 15