rules = ( Rule(LinkExtractor(allow=r'firm'), callback='parse_item', process_links='parse_link'),
老师您好,crawl spider类的爬虫,能不能只修改parse_item对应的header?修改def _requests_to_follow(self, response)函数好像对所有请求的header修改了,不能满足需求。
带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎
了解课程