请稍等 ...

scrapy如何实时接收url实时返回结果

老师你好，经过学习，认识到scrapy好像都是后台进行目标站点预先爬取大量数据，并且存到数据库之后，前端再调用数据库的。

有没有什么思路是实现：用户大量，并且各用户可能随时传入一个接口url调用数据，url可能重复，但调取的数据量不算大，希望爬虫针对每个用户传入的url，实时到接口爬取相应数据并返回。有何种办法或者是否有相关的项目案例可参考？

changezyc 2018-05-21 00:10:10

源自：15-1 es完成搜索建议-搜索建议字段保存 - 1

938

收起

提交取消

1回答

bobby 2018-05-22 18:28:23

你是想根据用户的请求实时抓取吧，这种情况除非你有强大的后台以及强大的ip资源，不然你做不到的或者你购买ip资源服务

0 回复有任何疑惑可以回复我~

收起回答

提问者 changezyc #1

对对对就是根据用户请求实时抓取，假设资源和后台不是问题，但是好像也没有办法做到“实时”吧，毕竟还是有爬取解析到回送还是有一定延时。那老师，如果有资源的情况下，大概什么思路呢？后者有没有相应的框架能实现？

回复有任何疑惑可以回复我~ 2018-05-23 09:37:22

bobby 回复提问者 changezyc #2

当然有延迟，但是如果你的资源没有问题 延迟也就请求url的时间 也就几秒 还是可以接受的吧

回复有任何疑惑可以回复我~ 2018-05-24 15:04:03

相似问题

怎样实现scrapy实时爬取,并将结果返回

scrapy如何实时接收url实时返回结果

实时调用 scrapy 像 ajax那样返回一个结果

如何实现提供restful接口，并实现增量爬取

Scrapy-Redis爬虫启动后，是如何做到进程不Close的

登录后可查看更多问答，登录/注册

Scrapy打造搜索引擎畅销4年的Python分布式爬虫课

参与学习 5831 人
解答问题 6293 个

带你彻底掌握Scrapy，用Django+Elasticsearch搭建搜索引擎

了解课程

本课精华内容

问答作业

Missing argument grant_type

5.7k 30

MysqlTwistedPipline的对象没有cursor属性

3.1k 18

知乎answer提取不到

1.8k 18

为什么知乎数据导入不到MySQL数据库中？

2.0k 15

运行 scrapy crawl jobbole 报错

3.6k 15

查看更多本课问答

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

scrapy如何实时接收url实时返回结果

正在回答回答被采纳积分+3

1回答

相似问题