采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
老师 我用分布式crawlSpider爬取一个电影网站 爬了一个多小时都还在爬url 它是把url全爬下来放在redis后才开始取出来解析吗?
你看看是不是到后面以后所有的数据返回的状态码不是200了呢
状态码都是200 但是很多不解析 我看redis的request指纹都有5000多条 为什么有些request不解析呢?
顺便问一下老师 分布式爬虫的话 重写start_request函数就 会报错 因为没有start-url了 怎么办 for url in start_url: yield要带参数怎么做呢
nl爬完全部url也不提取!!
登录后可查看更多问答,登录/注册
带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎
4.7k 30
2.5k 18
1.1k 18
1.3k 15
2.7k 15