采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
遇到几个小问题
1、有时爬虫无法进入问题解析函数就自己停止了,原因好像是将知乎首页https的链接写成了http,导致一会儿爬虫自己找到了https的链接,一会儿找不到。
2、有时question_item会有好几个值取不到,找了相关链接,一切代码都正常。还没找到原因。
scrapy处理https是没有问题的 你可以看一下pycharm的console是不是某些页面的状态码不是200?
question_item有可能是因为知乎的接口数据格式变了, 你根据你能提取到的值继续课程就行了
登录后可查看更多问答,登录/注册
带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎
4.7k 30
2.5k 18
1.1k 18
1.3k 15
2.7k 15