请稍等 ...

scrapy+selenium滚动翻页

1、老师我现在用scrapy+selenium技术去爬评论数据，别人现在设计的是一种滚动翻页的模式，每次显示5条数据，但是评论数据却有几十万条，我如何加速这个爬虫效率，有没有好的方案？
2、我也看了一下网站获取评论的滚动地址，访问一次就没有了，只能用一次。

qq_多爱一下_03725241 2022-04-24 21:57:40

源自：1-1 python分布式爬虫打造搜索引擎简介

1022

收起

提交取消

1回答

bobby 2022-04-25 09:53:58

这种情况要么看前端源码看看请求是如何构造的，要么就不停的多启动几个selenium去不停的滚动下拉

0 回复有任何疑惑可以回复我~

收起回答

提问者 qq_多爱一下_03725241 #1

1、抖音的地址:https://www.douyin.com/video/6854498059699686663
2、不停的多启动几个selenium去不停的滚动下拉，该如何去实现？有没有文档地址可以参考的。

回复有任何疑惑可以回复我~ 2022-04-25 11:13:57

bobby 回复提问者 qq_多爱一下_03725241 #2

多启动几个selenium去请求多个视频， 多个selenium肯定没法加速同一个视频的访问的，不停的下拉就是控制selenium拉到底

回复有任何疑惑可以回复我~ 2022-04-28 09:25:10

相似问题

老师，我还有问题！我用那个scroll插件一个问题，就是我把所有数据翻页翻完了之后，我再去重新调数据

selenium模拟微博登录后，对某一个url请求，返回来的source_page仍没有加载script脚本。

scrapy selenium登录

selenium集成scrapy

登录后可查看更多问答，登录/注册

Scrapy打造搜索引擎畅销4年的Python分布式爬虫课

参与学习 5831 人
解答问题 6293 个

带你彻底掌握Scrapy，用Django+Elasticsearch搭建搜索引擎

了解课程

本课精华内容

问答作业

Missing argument grant_type

5.7k 30

MysqlTwistedPipline的对象没有cursor属性

3.1k 18

知乎answer提取不到

1.8k 18

为什么知乎数据导入不到MySQL数据库中？

2.0k 15

运行 scrapy crawl jobbole 报错

3.6k 15

查看更多本课问答

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

scrapy+selenium滚动翻页

正在回答回答被采纳积分+3

1回答

相似问题