请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

关于Item数据错误问题

老师,您好。
我的项目在爬取文章时出现了这样一个错误,好几条数据的某一个字段值是一样的,如下图:
图片描述

我的代码如下:
图片描述

经过我的研究,我发现这几条数据中,只有第一条数据这个字段有返回,其余几条 没有返回这个字段,导致后边几个字段沿用了第一条返回的值。

下图是我搜的这个字段,8条数据只有一个有返回值:

图片描述

pipline.py中的代码:
图片描述

请问老师,我应该怎么改呢?

正在回答 回答被采纳积分+3

1回答

bobby 2020-04-16 18:22:14

你可以看看这些重复的item中的url是不是同一个url?

0 回复 有任何疑惑可以回复我~
  • 提问者 慕后端4419857 #1
    实例化item = items.ScrapyweiboItem()的位置写错了,应该是有几条数据就实例化几个item,我的上图里我的item只实例化了一次,所有数据公用一个item。如果第1条数据field 第2条数据中没有,就继承了第一条数据的值。我把item = items.ScrapyweiboItem() 写道for i in range()中就可以了。
    回复 有任何疑惑可以回复我~ 2020-04-18 12:13:23
  • bobby 回复 提问者 慕后端4419857 #2
    好的,
    回复 有任何疑惑可以回复我~ 2020-04-19 15:44:14
问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信