请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

京东商城爬取时多出了一个超出目标范围的商品

在爬去京东的商品的时候把旁边的广告商品也爬去进去了,这是为什么
ul_list=selector.xpath(’//div[@class=“ml-wrap”]/div[@id=“J_goodsList”]/ul[@class=“gl-warp clearfix”]/li[@class=“gl-item”]’)
这是要爬去的数据列表,但是爬去到最后的结果是把旁边的广告列表页爬取了

商品名称:【亮铂金键盘套装】微软(Microsoft)Surface Pro 6 二合一平板电脑笔记本
商品价格:6988.00
[]

这个是广告列表里面的商品

正在回答 回答被采纳积分+3

1回答

NavCat 2019-01-22 13:35:38

这样你就需要仔细分析京东页面的结构了,对比一下广告商品和列表的商品HTML结构有什么不一样,然后根据不一样的地方重新写xpath表达式进行爬取就解决了

0 回复 有任何疑惑可以回复我~
问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信