采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
小白的我对分布式有太多的疑点了,特别想知道怎么在多台主机上如何部署爬虫并进行管理。老师只是讲解了Scrapy-Redis的源码,没有深入去利用一个项目去讲解多台主机部署爬虫并抓取,稍微有一点点失望,现在毕设要求实现分布式爬取,后面分布式的思路不是很清晰。不过老师之前的内容讲得很不错,颇有收获,很是感谢
分布式爬虫部署你只需要在多台服务器上启动就行了,因为这个爬虫是从redis中获取的url进行抓取,所以多台服务器上的redis连接配置到同一台服务器上的redis连接就行了,这样就完成了ur的统一调用,但是抓取逻辑是分布到各个服务器的
老师,我想请教一下怎么将Scrapyd对接Docker,如果每台主机都要配置Scrapyd和环境就太麻烦了
你可以看看这个项目 https://github.com/aciobanu/docker-scrapy
登录后可查看更多问答,登录/注册
带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎
5.6k 30
3.0k 18
1.7k 18
1.9k 15
3.5k 15
购课补贴联系客服咨询优惠详情
慕课网APP您的移动学习伙伴
扫描二维码关注慕课网微信公众号