采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
发现爬取知乎的时候,一直在保存答案的数据,一条问题的数据都没有,运行代码的时候也没有报错
请问老师这个应该怎么排查呢
同学请问你抓取answer数据的时候改动老师在zhihu.py里的代码了么,我也没有报错,就是爬虫会自己关闭
你可以在解析question的方法中打断点 看看能不能进入这个逻辑,如果能进入那证明确实抓到数据了,有可能是入库失败了,如果进入不了那证明是没有抓到这些数据
parser_question应该是进入了,因为pasre_answer这个请求都是在parse_question yield出去的
我有1个疑问,pipline里都是调用item.save_to_es()这个方法,scrapy可以判断是answer item 还是question item吗
..不好意思,偶然发现问题了,questioni tem里的save_to_es()这个方法我缩进没缩好,定义到其他方法里去了
登录后可查看更多问答,登录/注册
带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎
4.8k 30
2.5k 18
1.1k 18
1.4k 15
2.8k 15