请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

crawl spider 修改header

 rules = (
        Rule(LinkExtractor(allow=r'firm'), callback='parse_item', process_links='parse_link'),

老师您好,crawl spider类的爬虫,能不能只修改parse_item对应的header?修改def _requests_to_follow(self, response)函数好像对所有请求的header修改了,不能满足需求。

正在回答

1回答

bobby 2018-04-28 15:57:51

我不太明白你的需求 值修改parse_item的header是什么意思呢 能举个例吗?

0 回复 有任何疑惑可以回复我~
  • 提问者 慕丝8011162 #1
    rules = (
            Rule(LinkExtractor(allow=r'firm'), callback='parse_item', process_links='parse_link'),
            Rule(LinkExtractor(allow=r'industry'), follow=True),
        )
    
    比如这种,如果没有callback,它默认有一个回调函数,这时有一个header;但是如果有了callback,让它执行我们指定的回调函数,这时我们怎么修改header和cookie?不能影响那种没有callback情况的下的header。
    回复 有任何疑惑可以回复我~ 2018-04-29 16:23:20
  • bobby 回复 提问者 慕丝8011162 #2
    课程后面我会讲scrapy的组件开发 用组件去完成
    回复 有任何疑惑可以回复我~ 2018-05-02 10:32:43
  • 提问者 慕丝8011162 #3
    非常感谢!
    回复 有任何疑惑可以回复我~ 2018-05-02 16:39:33
问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信