采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
老师,bloomfilter去重的指纹也是放到redis里去的吧?
可以这样理解,其实就是将指纹映射到一个位置上而已
去重指纹是不是就是在redis-cli里面输入keys *后返回的xxx:dupefilter? 想再问一下那个xxx:requests是什么?是不是也是不同爬虫节点存的未爬请求?可以由不同节点拿去爬的?
是的, requests是等待排队需要进一步抓取的url,这个可以由不同节点的爬虫去获取
谢谢老师
登录后可查看更多问答,登录/注册
带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎
4.7k 30
2.5k 18
1.1k 18
1.3k 15
2.7k 15