不是每个网页都存在,比如有些网页没有tags,我还用tags的class去统一取得时候,就会出现一个空列表[],之后再itemloader.load_item()的时候就会报错。class 'KeyError'。怎么办?我试图在input_processor中,给一个自定义的方法,如果value为空,就给它一个"",还是会报错。这种情况在爬取网页中很频繁,因为有些网页就是缺少一些字段,而大部分网页又存在,能否通过一个middleware还是其他什么扩展的方法统一处理呢??请老师给一些代码参考。谢谢
带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎
了解课程