采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
老师,爬取博客园的那个,问什么我只能爬取到每一页的第一条,其他的都爬取不了
中途有没有报错信息 或者非200的状态码?
没有的,我看控制台信息到第七页就是302,那是需要登录,数据库也只有前六页的第一条数据,只能拿到没页的第一条数据。但是我把循环内的xpath换成css解析就可以正常爬取数据,难道是xpath不可以连续解析吗
那估计是xpath写错了 你截图我看看你的xpath是如何写的?
老师,我发到另外一个回答了,你看看
这是所有的xpath了
for循环里面的xpath提取要./开头
哇,是的,我也出现这个问题了,在/前加了.就可以了,太谢谢了!
登录后可查看更多问答,登录/注册
带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎
5.3k 30
2.9k 18
1.6k 18
1.8k 15
3.4k 15
购课补贴联系客服咨询优惠详情
慕课网APP您的移动学习伙伴
扫描二维码关注慕课网微信公众号