老师你好,问一个课外问题,我爬一个网站,共3级页面,其中第二级页面只做中转,不做数据保存。
一级页面有三百多条数据,每条数据对应的一个链接可以跳转到二级页面,二级页面有几十到几百个链接不定,然后每个链接对应一个三级页面。
假如我只爬取一级页面,速度很快,(无关数据量多少,就是纯爬取速度)。
可是如果我要是一级和三级页面一起爬取(以三级页面数据获取速度来讲),刚开始速度特别快,每分钟几百条,而仅仅一会之后,速度下降到每分钟几条。
带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎
了解课程