请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

现在知乎是前后端分离,scrapy默认不支持动态加载。

默认的response和浏览器的源码查看,有相当大的出入,有些数据是没有的,应该都是动态加载。

希望后续可以补充下 scrapy-splash 抓取动态内容。

正在回答 回答被采纳积分+3

1回答

bobby 2018-05-09 16:02:24

动态网站的抓取我会在后面章节介绍的 而且不建议使用scrapy-splash用chromedriver比较好

0 回复 有任何疑惑可以回复我~
  • 提问者 冼星扉 #1
    为什么不建议?
    回复 有任何疑惑可以回复我~ 2018-05-10 14:23:02
  • bobby 回复 提问者 冼星扉 #2
    scrapy-splash 不稳定 而且容易出错 建议后尽量用chromedriver 这个已经支持headless模式了
    回复 有任何疑惑可以回复我~ 2018-05-10 16:17:55
  • 提问者 冼星扉 回复 bobby #3
    splash也使用了下,很吃cpu,单核扛不住
    回复 有任何疑惑可以回复我~ 2018-05-10 17:48:03
问题已解决,确定采纳
还有疑问,暂不采纳
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号