采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
老师 我用分布式crawlSpider爬取一个电影网站 爬了一个多小时都还在爬url 它是把url全爬下来放在redis后才开始取出来解析吗?
你看看是不是到后面以后所有的数据返回的状态码不是200了呢
状态码都是200 但是很多不解析 我看redis的request指纹都有5000多条 为什么有些request不解析呢?
顺便问一下老师 分布式爬虫的话 重写start_request函数就 会报错 因为没有start-url了 怎么办 for url in start_url: yield要带参数怎么做呢
nl爬完全部url也不提取!!
登录后可查看更多问答,登录/注册
带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎
4.9k 30
2.6k 18
1.3k 18
1.5k 15
3.0k 15
购课补贴联系客服咨询优惠详情
慕课网APP您的移动学习伙伴
扫描二维码关注慕课网微信公众号