请稍等 ...

对于知乎爬虫逻辑的问题

老师您好，我差不多学习完了整个知乎的爬虫。对于验证码识别那一部分收获很多。
但是对于后面的知乎爬虫的逻辑，是不是只进行了知乎第一页问题列表的采集，没有问题列表页的翻页呢？
还是我落下了什么

慕丝7238044 2020-03-04 17:10:06

源自：6-19 保存数据到mysql中 -1

1194

收起

提交取消

1回答

bobby 回答被采纳获得+3积分 2020-03-05 11:19:09

知乎的爬虫只通过列表页肯定不行，要尽量多的抓取，可以采用深度抓取比如随便进入一个问题，右侧会有相关问题，通过这些相关问题继续深度抓取就能抓取很多的问题，如果遇到用户了点击进入用户主页也能抓到很多问题

0 回复有任何疑惑可以回复我~

收起回答

提问者慕丝7238044 #1

谢谢老师 之前写过的大多数都是列表-详情页的逻辑。对深度优先一直没什么尝试

回复有任何疑惑可以回复我~ 2020-03-05 11:23:42

bobby 回复提问者慕丝7238044 #2
```
好的，在scrapy中只需要在该yield的地方yield request就行了
```
回复有任何疑惑可以回复我~ 2020-03-05 11:36:04

相似问题

关于爬虫发展前景

老师下一门的Python爬虫系列实战课程是《高级爬虫工程师》？

爬虫

老师，你是又开了一门爬虫课？

两个或两个以上的网站爬取算是分布式爬虫吗？我这样写可以启动无数个爬虫程序吧？为啥启动完第一个就直接结束了呢？

登录后可查看更多问答，登录/注册

Scrapy打造搜索引擎畅销4年的Python分布式爬虫课

参与学习 5831 人
解答问题 6293 个

带你彻底掌握Scrapy，用Django+Elasticsearch搭建搜索引擎

了解课程

本课精华内容

问答作业

Missing argument grant_type

5.7k 30

MysqlTwistedPipline的对象没有cursor属性

3.1k 18

知乎answer提取不到

1.8k 18

为什么知乎数据导入不到MySQL数据库中？

2.0k 15

运行 scrapy crawl jobbole 报错

3.6k 15

查看更多本课问答

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

对于知乎爬虫逻辑的问题

正在回答

1回答

相似问题