请稍等 ...

爬取其他网页（豆瓣）的时候，抓取的htmls字符串好像不全

想抓豆瓣热门电影并且排个名，用一样的代码，但是在 __fetch_content 方法中想要的 htmls 字符（电影名字和评分）抓不出来，请问老师这是怎么回事？

链接：https://movie.douban.com/explore#!type=movie&tag=%E7%83%AD%E9%97%A8&sort=recommend&page_limit=20&page_start=0

德瑞德 2017-10-24 11:21:45

源自：13-4 VSCode中调试代码

1410

收起

提交取消

2回答

7七月 2017-10-24 17:35:03

可能这个页面的内容是通过脚本发Ajax获取的动态数据。所以直接抓取是抓不到的。

0 回复有任何疑惑可以回复我~

收起回答

runzx 2017-10-24 13:48:24

你选的这个页面是动态页面，就是说你用urllib.request访问的内容和你在PC上看到的不是一个。所以直接__fech_content() 是抓不到的。要编写模拟网页能的执行JS的方法，才能最终取得你IE上看到的内容。

分析此页面的网络后，得到 https://movie.douban.com/j/search_subjects?type=movie&tag=%E7%83%AD%E9%97%A8&sort=recommend&page_limit=20&page_start=0

这可以直接取回JSON格式的内容。

0 回复有任何疑惑可以回复我~

收起回答

相似问题

因为抓取得html数据不全root_htmls为空

基于CrawlSpider，同一份代码爬取多个网站的数据，如果限制不爬取外链网站数据

爬取结果和网页源代码不同

内容管理平台数据抓取，深度优先模式抓取问题

知乎爬取问题

登录后可查看更多问答，登录/注册

Python3.8系统入门+进阶 (程序员必备第二语言)

参与学习 14909 人
提交作业 1291 份
解答问题 4506 个

语法精讲/配套练习+思考题/原生爬虫实战

了解课程

本课精华内容

问答作业

老师，学习python对于文化程度相对低一点的，比如高中学历的，或者专科非计算机专业的人，以后的就业会有什么困难？怎么去克服好？学习应该往那个方向方便就业呢？

7.0k 7

爬虫方向的学习路线

3.2k 3

评论区消耗金为1003和914两种不同答案的原因

3.0k 5

VScode 安装完毕，插件也下载好没问题。但是没有出现pylint 绿色的波浪线。是设置问题么？

4.9k 23

小兄弟,我要投诉你了,你每一节视频有多时间是讲课的?都是跟别人聊天,我花钱是来学习的,不是来跟你聊天的,希望你尊重别人的宝贵时间.

3.2k 19

查看更多本课问答

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

爬取其他网页（豆瓣）的时候，抓取的htmls字符串好像不全

正在回答回答被采纳积分+3

2回答

相似问题