02
23
19
05
请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

京东商城爬取时多出了一个超出目标范围的商品

在爬去京东的商品的时候把旁边的广告商品也爬去进去了,这是为什么
ul_list=selector.xpath(’//div[@class=“ml-wrap”]/div[@id=“J_goodsList”]/ul[@class=“gl-warp clearfix”]/li[@class=“gl-item”]’)
这是要爬去的数据列表,但是爬去到最后的结果是把旁边的广告列表页爬取了

商品名称:【亮铂金键盘套装】微软(Microsoft)Surface Pro 6 二合一平板电脑笔记本
商品价格:6988.00
[]

这个是广告列表里面的商品

正在回答 回答被采纳积分+3

插入代码

1回答

NavCat 2019-01-22 13:35:38

这样你就需要仔细分析京东页面的结构了,对比一下广告商品和列表的商品HTML结构有什么不一样,然后根据不一样的地方重新写xpath表达式进行爬取就解决了

0 回复 有任何疑惑可以回复我~
问题已解决,确定采纳
还有疑问,暂不采纳
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号