采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
请问老师,我已经成功搭建起搜索引擎,但还是有许多地方不是很明白,我想问一下我们构建的搜索引擎所用到的数据是分布式爬虫爬取的吗,分布式爬虫与搜索引引擎之间的联系是怎样的
搜索引擎网站的逻辑和分布式爬虫是两个服务,也是分离的,爬虫停止了不应该影响网站的搜索,无非就是无法搜索最新的数据而已,两个服务通过es交互,也就是是爬虫将数据入库到es中,django系统从es中进行数据的检索
是不是就是说如果我想把爬虫改造为分布爬虫只需要在scrapy的setting 里面做一些修改然后把scrapy分布式爬虫搜取的信息输入elasticsearch 中就可以了
是的 分布式爬虫使用scrapy-redis 不要直接使用官方的scrapy
登录后可查看更多问答,登录/注册
带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎
4.8k 30
2.6k 18
1.2k 18
1.4k 15
2.9k 15