请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

博客园只能爬取每页的第一条,什么鬼啊

老师,爬取博客园的那个,问什么我只能爬取到每一页的第一条,其他的都爬取不了
图片描述

正在回答 回答被采纳积分+3

2回答

bobby 2020-01-05 11:28:00

中途有没有报错信息 或者非200的状态码?

1 回复 有任何疑惑可以回复我~
  • 提问者 谁说我胖 #1
    没有的,我看控制台信息到第七页就是302,那是需要登录,数据库也只有前六页的第一条数据,只能拿到没页的第一条数据。但是我把循环内的xpath换成css解析就可以正常爬取数据,难道是xpath不可以连续解析吗
    回复 有任何疑惑可以回复我~ 2020-01-05 11:41:29
  • bobby 回复 提问者 谁说我胖 #2
    那估计是xpath写错了 你截图我看看你的xpath是如何写的?
    回复 有任何疑惑可以回复我~ 2020-01-06 14:34:41
  • 提问者 谁说我胖 回复 bobby #3
    老师,我发到另外一个回答了,你看看
    回复 有任何疑惑可以回复我~ 2020-01-10 15:45:08
提问者 谁说我胖 2020-01-10 15:44:14

https://img1.sycdn.imooc.com/szimg/5e182b3809b5755512310767.jpg

这是所有的xpath了

0 回复 有任何疑惑可以回复我~
问题已解决,确定采纳
还有疑问,暂不采纳
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号