采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
老师,我有个思路:爬取小说的时候,先把1000页的小说列表获取完,然后查询数据库取每本书的链接去获取目录,再去获取书的内容
A所有小说列表 B所有小说目录 C所有小说内容
A----->B------>C
这个我去实现了,但是走不通。是不是我的思路有问题,或者不能这样操作
是不是循环里面不能开线程么,
我这样执行会导致什么呢
因为小说列表开了10个线程,小说目录也开了10个线程,导致列表没跑完,就跑目录了
你上面的部分是每个都是使用了join方法的,但是你的十个线程就是只有十页数据吗?如果这十个线程执行完成以后就代表join已经完成了 是不是你的十个线程只爬取一个列表页?
问题解决了,了谢谢
好的。
行不通是什么意思 有什么问题? 思路听起来没有什么问题
登录后可查看更多问答,登录/注册
慕课网严选精品教程,高质量内容+服务!
1.3k 20
1.5k 17
1.2k 17
1.1k 17
1.4k 13