请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

知乎爬取数据问题

发现爬取知乎的时候,一直在保存答案的数据,一条问题的数据都没有,运行代码的时候也没有报错
图片描述

请问老师这个应该怎么排查呢

正在回答 回答被采纳积分+3

2回答

慕工程9236377 2019-05-27 08:06:26

同学请问你抓取answer数据的时候改动老师在zhihu.py里的代码了么,我也没有报错,就是爬虫会自己关闭

0 回复 有任何疑惑可以回复我~
bobby 2019-05-10 12:50:45

你可以在解析question的方法中打断点 看看能不能进入这个逻辑,如果能进入那证明确实抓到数据了,有可能是入库失败了,如果进入不了那证明是没有抓到这些数据

0 回复 有任何疑惑可以回复我~
  • 提问者 简单51799 #1
    parser_question应该是进入了,因为pasre_answer这个请求都是在parse_question yield出去的
    回复 有任何疑惑可以回复我~ 2019-05-10 12:54:33
  • 提问者 简单51799 #2
    我有1个疑问,pipline里都是调用item.save_to_es()这个方法,scrapy可以判断是answer item 还是question item吗
    回复 有任何疑惑可以回复我~ 2019-05-10 12:57:11
  • 提问者 简单51799 #3
    ..不好意思,偶然发现问题了,questioni tem里的save_to_es()这个方法我缩进没缩好,定义到其他方法里去了
    回复 有任何疑惑可以回复我~ 2019-05-10 13:44:28
问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信