请稍等 ...

在遍历元素时xpath和css选择器为什么结果不一样

代码如下:

post_nodes = response.xpath('//div[@id="news_list"]/div[@class="news_block"]')
# post_nodes = response.css('#news_list .news_block')

for post_node in post_nodes:
   # print(post_node)
   image_url = post_node.xpath('//div[@class="entry_summary"]/a/img/@src').extract()
   image_url = post_node.css('.entry_summary a img::attr(src)').extract()

用path结果如下:
图片描述
用css结果如下:

问题:
从结果分析是css正确的应该是每次遍历只能获取一个值
但是为什么用xpath却获取了所有的值,这明显是不对的

慕雪9382207 2020-05-27 23:12:02

源自：4-9 编写spider完成抓取过程 - 1

1103

收起

提交取消

1回答

bobby 2020-05-28 13:03:13

xpath尝试一下将双斜线改为单斜线或者去掉双斜线试试

0 回复有任何疑惑可以回复我~

收起回答

提问者慕雪9382207 #1

不行，但是如果改成下面的就可以，也不知道为什么
 post_node = Selector(text=post_node)
            image_url = post_node.xpath('//div[@class="entry_summary"]/a/img/@src').extract_first("")

回复有任何疑惑可以回复我~ 2020-05-28 14:07:08

bobby 回复提问者慕雪9382207 #2
```
这样会不会重复？
```
回复有任何疑惑可以回复我~ 2020-05-29 12:16:27
陳根生回复提问者慕雪9382207 #3
```
xpath的for循环在//前面要加上.点，不然会重复的
```
回复有任何疑惑可以回复我~ 2020-07-19 22:46:45