请稍等 ...

把selenium集成到scrapy中间件（已在setting文件设置启动中间件），运行时却无法启动中间件

具体代码如下
 
#中间件
from selenium import webdriver
from scrapy.http import HtmlResponse
import time
class ChromeMiddlewares(object):
    def process_request(cls,request,spider):
        if request.meta.has_key('Chrome'):
            driver=webdriver.Chrome()
            driver.get(request.url)
            driver.find_element_by_name('account').send_keys('13808847170')
            driver.find_element_by_name('password').send_keys('aa886688')
            time.sleep(7)
            driver.find_element_by_xpath("/html/body/div[1]/div/div[2]/div[2]/form/div[2]/button").click()
            time.sleep(7)
            for i in range(3):
                driver.execute_script('window.scrollBy(0,3000)')
                time.sleep(5)
            content=driver.page_source
            driver.quit()
            filename='zhihu.html'
            with open(filename,'wb')as fp:
                fp.write(content.encode('utf-8'))
            return HtmlResponse(request.url,body=content,encoding='utf-8',request=request)
             
             
             
#spider文件
# -*- coding: utf-8 -*-
import scrapy
class TestmoniSpider(scrapy.Spider):
    name = "testmoni"
    allowed_domains = ["https://www.zhihu.com/"]
    start_urls = []
 
def start_requests(self):
    urls='https://www.zhihu.com/#signin'
    rq=scrapy.Request(url=urls,callback=self.parse)
    rq.meta['Chrome']=True
    yield rq
 
    def parse(self, response):#这个函数主要写解析
        print response.text
         
         
setting文件
DOWNLOADER_MIDDLEWARES={'testselenium.middlewares.ChromeMiddlewares':1,}

慕先生0421411 2017-05-27 16:26:03

源自：9-4 selenium集成到scrapy中

2414

收起

提交取消

1回答

bobby 2017-05-29 15:51:45

无法启动是什么问题，是无法启动chrome还是无法进入process_request函数，你有没有debug过

1 回复有任何疑惑可以回复我~

收起回答

提问者慕先生0421411 #1

我debug过，是无法启动中间件，为了验证是不是无法启动chrome，又单独写了一个测试chrome的py，结果是chrome能正常启动运行的

回复有任何疑惑可以回复我~ 2017-05-29 17:46:01

bobby 回复提问者慕先生0421411 #2

你的意思是无法进入到process_request 函数？ 你试试将process_request函数改为def process_request(self, request, spider):

回复有任何疑惑可以回复我~ 2017-06-01 09:45:15

相似问题

virtualbox中虚拟机时间不能与主机同步

war包无法解压出o2o文件，看log，对docBase进行了正反斜杠的实验，并重启了tomcat都无法成功解压

请问，在auth.js的中间件中，获取的ctx.session是空对象，这是怎么回事？

挂载文件，docker container中的配置文件没有同步到Host映射的目录中来

pxc主节点启动不起来

登录后可查看更多问答，登录/注册

Scrapy打造搜索引擎畅销4年的Python分布式爬虫课

参与学习 5807 人
解答问题 6290 个

带你彻底掌握Scrapy，用Django+Elasticsearch搭建搜索引擎

了解课程

本课精华内容

问答作业

Missing argument grant_type

4.9k 30

MysqlTwistedPipline的对象没有cursor属性

2.6k 18

知乎answer提取不到

1.3k 18

为什么知乎数据导入不到MySQL数据库中？

1.5k 15

运行 scrapy crawl jobbole 报错

3.0k 15

查看更多本课问答

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

把selenium集成到scrapy中间件（已在setting文件设置启动中间件），运行时却无法启动中间件

正在回答回答被采纳积分+3

1回答

相似问题

请选择置顶位置

本课精华内容

Missing argument grant_type

MysqlTwistedPipline的对象没有cursor属性

知乎answer提取不到

为什么知乎数据导入不到MySQL数据库中？

运行 scrapy crawl jobbole 报错

【讨论题】你认为什么是 JS 逆向？

有没有方法可以比较准确的解析出 title 和正文内容

如何将数据的保存和抓取独立出来？

如何将 nodejs 服务集成进来呢？

【讨论题】字体反爬应该如何解析？

热搜

最近搜索清空

把selenium集成到scrapy中间件（已在setting文件设置启动中间件），运行时却无法启动中间件

正在回答 回答被采纳积分+3

1回答

相似问题

请选择置顶位置

本课精华内容

Missing argument grant_type

MysqlTwistedPipline的对象没有cursor属性

知乎answer提取不到

为什么知乎数据导入不到MySQL数据库中？

运行 scrapy crawl jobbole 报错

【讨论题】你认为什么是 JS 逆向？

有没有方法可以比较准确的解析出 title 和正文内容

如何将数据的保存和抓取独立出来？

如何将 nodejs 服务集成进来呢？

【讨论题】字体反爬应该如何解析？

正在回答回答被采纳积分+3