请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

我这样爬取有问题么

老师,我有个思路:爬取小说的时候,先把1000页的小说列表获取完,然后查询数据库取每本书的链接去获取目录,再去获取书的内容

A所有小说列表
B所有小说目录
C所有小说内容

A----->B------>C

这个我去实现了,但是走不通。是不是我的思路有问题,或者不能这样操作

正在回答 回答被采纳积分+3

4回答

提问者 慕无忌8052570 2020-09-21 19:30:29

https://img1.sycdn.imooc.com/szimg/5f688eb5099557c723900780.jpg

是不是循环里面不能开线程么,   

0 回复 有任何疑惑可以回复我~
提问者 慕无忌8052570 2020-09-21 14:13:26

https://img1.sycdn.imooc.com//szimg/5f68446b08eca5da16761180.jpg我这样执行会导致什么呢

0 回复 有任何疑惑可以回复我~
提问者 慕无忌8052570 2020-09-21 14:11:00

因为小说列表开了10个线程,小说目录也开了10个线程,导致列表没跑完,就跑目录了

0 回复 有任何疑惑可以回复我~
  • bobby #1
    你上面的部分是每个都是使用了join方法的,但是你的十个线程就是只有十页数据吗?如果这十个线程执行完成以后就代表join已经完成了 是不是你的十个线程只爬取一个列表页?
    回复 有任何疑惑可以回复我~ 2020-09-22 10:20:02
  • 提问者 慕无忌8052570 回复 bobby #2
    问题解决了,了谢谢
    回复 有任何疑惑可以回复我~ 2020-10-05 15:15:44
  • bobby 回复 提问者 慕无忌8052570 #3
    好的。
    回复 有任何疑惑可以回复我~ 2020-10-08 10:39:27
bobby 2020-09-20 13:09:04

行不通是什么意思 有什么问题? 思路听起来没有什么问题

0 回复 有任何疑惑可以回复我~
问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信