老师好,我是初学者,针对"抓取过程"的部分,我看了三次感觉还是一知半解,想请以下的理解正确吗?
一丶
spider与scrapy.Request的功能连用,可视为一个递回(Recursion)的方法,透过不断的将新的URL传递出去,并再次调用spider类来进行相对应的parse
二丶
scrapy.Request的主要用途是让爬取的过程可以实现异步的效果
三丶
每一组Request与parse的搭配,可视为一个业务逻辑,针对不同的URL类别(或组别,如标题丶图片等等),客制化一套处理方法,再将parse方法从callback参数中传进去,让该次业务逻辑调用某一套客制化的parse
希望老师能协助补全一下知识,感谢您
带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎
了解课程