关于scrapy爬取天气数据的问题-慕课网

1回答

bobby 2020-09-26 17:02:09

1. 如果使用requests有问题的话使用scrapy并不一定能解决

2. allowed_domains = ["wis.qq.com"] start_urls就是你想要抓取的起始页

3. 覆盖start_reuests方法在该方法中自己拼接url 重新生成新的request 逐个yield出去即可

4. 如果自己有能力重写start_requests方法那么start_urls随便写，因为默认的start_requests就是从start_urls中逐个获取url并yield出去而已

0 回复有任何疑惑可以回复我~

收起回答

提问者四月C #1

感谢老师的回复，其余的问题已经解决了，现在还剩下查询数据库的省市区，拼出新的url了，打算写在def parse(self, response):方法中，但是不知道数据库查询的代码应该放在那里，Pipeline中吗？那这个值如何传递给def parse(self, response):这个方法呢，


新手发言，有些语无伦次，老师见谅。

回复有任何疑惑可以回复我~ 2020-09-27 14:01:20

bobby 回复提问者四月C #2

写在start_requests中啊，其实你也不用担心，后面会讲解scrapy-redis 到时候你将url直接放在redis的某个队列中就行了

回复有任何疑惑可以回复我~ 2020-09-28 10:29:16

关于scrapy爬取天气数据的问题

正在回答回答被采纳积分+3

1回答

相似问题

请选择置顶位置

本课精华内容

Missing argument grant_type

MysqlTwistedPipline的对象没有cursor属性

知乎answer提取不到

为什么知乎数据导入不到MySQL数据库中？

运行 scrapy crawl jobbole 报错

【讨论题】你认为什么是 JS 逆向？

有没有方法可以比较准确的解析出 title 和正文内容

如何将数据的保存和抓取独立出来？

如何将 nodejs 服务集成进来呢？

【讨论题】字体反爬应该如何解析？

热搜

最近搜索清空