请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

爬虫的网页格式

直接从网页复制下来的html代码 和 python经 str转码后爬下来的不一样,好像少了很多

https://img1.sycdn.imooc.com//szimg/5b6587000001073908300245.jpg

https://img1.sycdn.imooc.com//szimg/5b6587010001efa110700583.jpg

上面两张都是代码末尾的部分,但python爬下来的和F12直接看到为什么不一样。

正在回答 回答被采纳积分+3

1回答

7七月 2018-08-05 05:03:59

从你的截图看不出来,截图里好像根本就不是同一段代码

0 回复 有任何疑惑可以回复我~
  • 提问者 SD_Kaden #1
    问题就是 爬虫爬到的网页源码和按F12查看的网页源码不一致
    在网上查的说 ‘网页最终显示的页面源码是经过浏览器解释后的,你get或者post请求到的源码是服务器直接返回的,不一样是正常的。’
    是这样吗
    回复 有任何疑惑可以回复我~ 2018-08-05 05:07:59
  • 7七月 回复 提问者 SD_Kaden #2
    部分网页 会有js参与运算 导致不一样,这是动态网页。一般初学者爬爬静态的就可以了,动态的还是挺难得,需要专门研究爬虫技术
    回复 有任何疑惑可以回复我~ 2018-08-05 05:10:12
  • 提问者 SD_Kaden 回复 7七月 #3
    Thanks!
    回复 有任何疑惑可以回复我~ 2018-08-05 05:11:29
问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信