老师您能不能运行一下我下面的代码,html返回没有问题,有我需要提取的数据,而且我的xpath在XPath Helper
中验证过了,是正确的,可以提取到数据,但是为什么用代码抓取下来的列表就是空的?但是在代码中改用相对路径’//*[@href="/topics/396730744"]'就可以获取到数据,这两个xpath一个绝对路径一个相对路径,在插件中验证都是没问题的,但是不明白为什么只有相对路径的可以提取到数据。
from scrapy import Selector
import requests
res = requests.get(‘https://bbs.csdn.net/’,verify=False)
html = res.text
print html
sel = Selector(text=html)
t = sel.xpath(’/html/body/div[3]/div[2]/div[1]/div[3]/ul/li[8]/label/a[2]/text()’).extract()
print t