老师，我项目需要每次request都要selenium做代理，那这样，我怎么把页面信息传入response后，还从操作浏览器呢-慕课网

1回答

bobby 2021-04-29 19:15:02

课程中讲解了中间件的，你直接写一个middleware，直接拦截request请求然后使用selenium获取，原本这个request是要发送给downloader的，但是你拦截了并且直接return 了response了，那么原本应该交给downloader下载的就不会交给了，直接返回reponse就进入了你自己的处理逻辑了

0 回复有任何疑惑可以回复我~

收起回答

提问者慕工程0405147 #1

self.brower.quit()，我在parse下，是这样使用的，我没有照搬视频的那个模式，我是每个request都会去打开一个新的页面，因为使用的selenium的代理，如果按照视频的那个模式，后续每个url的ip都会是同样的

回复有任何疑惑可以回复我~ 2021-04-30 17:16:26

bobby 回复提问者慕工程0405147 #2
```
那你把你的主要代码的核心源码截图我看看呢
```
回复有任何疑惑可以回复我~ 2021-05-03 21:29:08

提问者慕工程0405147 回复 bobby #3

老师，我现在是代码在本地无论是命令行模式，还是ide去执行，都是正常，但是就是到了线上centos7里，scrapy就执行不起来selenium，但是在线上直接调用selenium又是正常的....

回复有任何疑惑可以回复我~ 2021-05-08 14:39:54

老师，我项目需要每次request都要selenium做代理，那这样，我怎么把页面信息传入response后，还从操作浏览器呢

正在回答回答被采纳积分+3

1回答

相似问题

请选择置顶位置

本课精华内容

Missing argument grant_type

MysqlTwistedPipline的对象没有cursor属性

知乎answer提取不到

为什么知乎数据导入不到MySQL数据库中？

运行 scrapy crawl jobbole 报错

【讨论题】你认为什么是 JS 逆向？

有没有方法可以比较准确的解析出 title 和正文内容

如何将数据的保存和抓取独立出来？

如何将 nodejs 服务集成进来呢？

【讨论题】字体反爬应该如何解析？

热搜

最近搜索清空