通过item_loader.add_css选择器定位到元素,两个字段只能通过列表的分片区分
比如,直接用css选择器是能得到area、language字段:
area = response.css(’.vodinfobox li span::text’)[6].extract()
language = response.css(’.vodinfobox li span::text’)[7].extract()
但是用item_loader,css选择器的地方都一样,后面的6 跟 7 需要怎么处理呢?
item_loader.add_css(‘area’, ‘.vodinfobox li span::text’)
item_loader.add_css(‘language’, ‘.vodinfobox li span::text’)
带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎
了解课程