请稍等 ...

职位爬取，直接在列表页面爬取，该怎么循环？

老师，拉勾网列表页面已经有了我所需要爬取的所有的字段信息，这样就不用在点击进入每一个网页进行爬取了。
不用item的时候，我是这样循环的，取值都没有问题。
job_divs = response.css(".sojob-item-main");
for job_div in job_divs:
job_detail_url = job_div.css(".job-info h3 a::attr(href)").extract()[0]
job_name = job_div.css(".job-info h3::attr(title)").extract()[0]

但是如果用item，这个方法该怎么调用呢？
for job_div in divs
调用方法，该如何调用？

列表页面：
job1
job2
job3
····

starkpan 2018-09-15 21:50:58

源自：7-1 数据表结构设计

816

收起

提交取消

1回答

提问者 starkpan 2018-09-15 23:44:05

用了一个折中的方法，没有用itemloader 而是直接返回的item就没有问题了。itemloader有循环可以用么，老师？

0 回复有任何疑惑可以回复我~

收起回答

bobby #1

你直接在for循环中生成多个itemloader 然后不停的yield就行了

回复有任何疑惑可以回复我~ 2018-09-18 14:45:34

提问者 starkpan 回复 bobby #2
```
好的，谢谢老师。
```
回复有任何疑惑可以回复我~ 2018-09-18 14:46:32

相似问题

知乎爬取问题

只爬取，不处理

两个或两个以上的网站爬取算是分布式爬虫吗？我这样写可以启动无数个爬虫程序吧？为啥启动完第一个就直接结束了呢？

知乎爬取answer

爬取拉钩要登录

登录后可查看更多问答，登录/注册

Scrapy打造搜索引擎畅销4年的Python分布式爬虫课

参与学习 5831 人
解答问题 6293 个

带你彻底掌握Scrapy，用Django+Elasticsearch搭建搜索引擎

了解课程

本课精华内容

问答作业

Missing argument grant_type

5.7k 30

MysqlTwistedPipline的对象没有cursor属性

3.0k 18

知乎answer提取不到

1.7k 18

为什么知乎数据导入不到MySQL数据库中？

1.9k 15

运行 scrapy crawl jobbole 报错

3.5k 15

查看更多本课问答

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

职位爬取，直接在列表页面爬取，该怎么循环？

正在回答回答被采纳积分+3

1回答

相似问题