请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

动态网页爬取的问题

老师,为了等待某些数据动态加载完成之后再爬取,我使用了selenium的WebDriverWait方法,达到了我的目的.但是由于爬取效率的问题,我决定使用splash来爬数据,可是英文文档里我没有找到splash对应selenium的WebDriverWait这样类似的方法,请问下老师splash等待某一段数据加载完了再爬取,这样的需求具体用哪个方法来实现呢?


如图:selenium我是这么做的,求splash对应的方法...

https://img1.sycdn.imooc.com//szimg/5b456ebe00013f8909090219.jpg

正在回答 回答被采纳积分+3

1回答

bobby 2018-07-13 11:16:38

不建议使用scrapy-splash来完成了 可以使用chromedriver的headless版本

0 回复 有任何疑惑可以回复我~
  • 提问者 慕神6516775 #1
    我看scrapy-splash的官网一直在持续更新中,效率比selenium也快了不少,为什么不可以使用呢?另外,最关键的是selenium的效率太低了,老师提到的重写下载器来提供异步支持,我这边真心不知道如何去做.
    回复 有任何疑惑可以回复我~ 2018-07-13 14:37:33
  • bobby 回复 提问者 慕神6516775 #2
    要自己重写异步的方式去实现下载器需要对twisted熟悉才行,如果对异步io不熟悉,难度会很大。scrapy-splash稳定性没有chromedriver高的
    回复 有任何疑惑可以回复我~ 2018-07-16 09:50:32
  • 提问者 慕神6516775 回复 bobby #3
    老师,您贴一段selenium异步下载器的代码给我们把,告诉我们如何使用即可,等我们能力提高了再自己写,您看这样可以么.
    回复 有任何疑惑可以回复我~ 2018-07-17 16:17:53
问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信