请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

如果老师能详细讲解一下分布式爬虫的部署就好了

小白的我对分布式有太多的疑点了,特别想知道怎么在多台主机上如何部署爬虫并进行管理。老师只是讲解了Scrapy-Redis的源码,没有深入去利用一个项目去讲解多台主机部署爬虫并抓取,稍微有一点点失望,现在毕设要求实现分布式爬取,后面分布式的思路不是很清晰。不过老师之前的内容讲得很不错,颇有收获,很是感谢

正在回答

1回答

bobby 2019-01-22 15:55:08

分布式爬虫部署你只需要在多台服务器上启动就行了,因为这个爬虫是从redis中获取的url进行抓取,所以多台服务器上的redis连接配置到同一台服务器上的redis连接就行了,这样就完成了ur的统一调用,但是抓取逻辑是分布到各个服务器的

0 回复 有任何疑惑可以回复我~
  • 提问者 HugoL #1
    老师,我想请教一下怎么将Scrapyd对接Docker,如果每台主机都要配置Scrapyd和环境就太麻烦了
    回复 有任何疑惑可以回复我~ 2019-01-24 21:11:43
  • bobby 回复 提问者 HugoL #2
    你可以看看这个项目 https://github.com/aciobanu/docker-scrapy
    回复 有任何疑惑可以回复我~ 2019-01-27 14:09:17
问题已解决,确定采纳
还有疑问,暂不采纳
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号