请稍等 ...

爬虫的网页格式

直接从网页复制下来的html代码和 python经 str转码后爬下来的不一样，好像少了很多

上面两张都是代码末尾的部分，但python爬下来的和F12直接看到为什么不一样。

SD_Kaden 2018-08-04 19:02:02

源自：13-8 正则分析获取名字和人数

1300

收起

提交取消

1回答

7七月 2018-08-05 05:03:59

从你的截图看不出来，截图里好像根本就不是同一段代码

0 回复有任何疑惑可以回复我~

收起回答

提问者 SD_Kaden #1

问题就是 爬虫爬到的网页源码和按F12查看的网页源码不一致
在网上查的说 ‘网页最终显示的页面源码是经过浏览器解释后的，你get或者post请求到的源码是服务器直接返回的，不一样是正常的。’
是这样吗

回复有任何疑惑可以回复我~ 2018-08-05 05:07:59

7七月回复提问者 SD_Kaden #2

部分网页 会有js参与运算 导致不一样，这是动态网页。一般初学者爬爬静态的就可以了，动态的还是挺难得，需要专门研究爬虫技术

回复有任何疑惑可以回复我~ 2018-08-05 05:10:12

提问者 SD_Kaden 回复 7七月 #3
```
Thanks!
```
回复有任何疑惑可以回复我~ 2018-08-05 05:11:29

相似问题

两个或两个以上的网站爬取算是分布式爬虫吗？我这样写可以启动无数个爬虫程序吧？为啥启动完第一个就直接结束了呢？

爬虫

请问源代码有实现scrapy-redis对招聘网站进行分布式爬虫吗

老师下一门的Python爬虫系列实战课程是《高级爬虫工程师》？

老师，运行京东网的爬虫出现错误

登录后可查看更多问答，登录/注册

Python3.8系统入门+进阶 (程序员必备第二语言)

参与学习 14850 人
提交作业 1268 份
解答问题 4493 个

语法精讲/配套练习+思考题/原生爬虫实战

了解课程

本课精华内容

问答作业

老师，学习python对于文化程度相对低一点的，比如高中学历的，或者专科非计算机专业的人，以后的就业会有什么困难？怎么去克服好？学习应该往那个方向方便就业呢？

6.8k 7

爬虫方向的学习路线

3.1k 3

评论区消耗金为1003和914两种不同答案的原因

2.9k 5

VScode 安装完毕，插件也下载好没问题。但是没有出现pylint 绿色的波浪线。是设置问题么？

4.7k 22

小兄弟,我要投诉你了,你每一节视频有多时间是讲课的?都是跟别人聊天,我花钱是来学习的,不是来跟你聊天的,希望你尊重别人的宝贵时间.

3.0k 19

查看更多本课问答

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

爬虫的网页格式

正在回答回答被采纳积分+3

1回答

相似问题