Selenium模拟登录知乎的问题-慕课网

1回答

提问者 Icarus1264 2019-05-07 10:17:50

老师，我已经找到解决方案，知道怎么通过最新版的Selenium来模拟登录知乎了，并可以获取cookie。

首先，前面先配置一个ChromeOptions()，并再其中添加如下配置：

from selenium.webdriver import Chrome
from selenium.webdriver import ChromeOptions

option = ChromeOptions()
option.add_experimental_option('excludeSwitches', ['enable-automation'])
driver = Chrome(executable_path=".../.../chromedriver.exe",options=option)

即开启了Google Chrome的开发者模式，默认的js都会变成和真的浏览器登录一样，然后就是继续模拟输入用户名、密码和点击登录按钮，但是不知道是知乎还是Chrome有Bug，点击按钮总是失败，所以我多加上了一个模拟点击回车按钮的操作，就可以正常模拟登录知乎，接下来就可以获取cookie了。示例代码如下，仅供参考：

参考来自：一行 js 代码识别 Selenium+Webdriver 及其应对方案

# -*- coding: utf-8 -*-
import time
import scrapy
from selenium.webdriver import Chrome, ChromeOptions
from selenium.webdriver.common.keys import Keys


class ZhihuSpider(scrapy.Spider):
    name = 'zhihu'
    allowed_domains = ['www.zhihu.com']
    start_urls = ['https://www.zhihu.com/']

    def start_requests(self):
        """
        scrapy中所有的spider都是从start_requests方法开始
        它会遍历所有的start_urls，并生成返回每一个Request请求
        我们只需要重写这个方法，每次都模拟登录知乎。
        :return:
        """

        # 构建一个模拟谷歌浏览器的配置文件
        options = ChromeOptions()

        # 添加开发者模式配置信息到配置文件
        options.add_experimental_option('excludeSwitches', ['enable-automation'])

        # 构建一个用于模拟浏览器操作的浏览器browser，并设置其所在的执行路径
        browser = Chrome(executable_path="C:/Users/Icarus/ArticleSpider/drivers/chromedriver.exe", options=options)

        # 模拟浏览器请求知乎登录页面
        browser.get("https://www.zhihu.com/signin")

        # 定位知乎登录页面中的用户名输入框，并模拟输入用户名
        browser.find_element_by_css_selector(".SignFlow-accountInput input[class='Input']").send_keys("13873288573")

        # 定位知乎登录页面中的密码输入框，并模拟输入密码
        browser.find_element_by_css_selector(
            ".SignFlow-password .SignFlowInput .Input-wrapper input[class='Input']").send_keys("qaz1584279" + Keys.ENTER)

        # 定位知乎登录页面中的登录按钮，并模拟点击登录按钮
        browser.find_element_by_css_selector(".Button.SignFlow-submitButton.Button--primary.Button--blue").click()

        # 暂停一下，观察结果
        time.sleep(60)

0 回复有任何疑惑可以回复我~

收起回答

bobby #1

确实js可以检测出自动启动的chrome浏览器，但是课程中已经讲解了另一种更简单的方法就是自己启动chrome浏览器，然后将selenium连接到这个真正的chrome中，你可以继续看课程的视频，有讲解这个内容的

回复有任何疑惑可以回复我~ 2019-05-08 14:59:04

Selenium模拟登录知乎的问题

正在回答回答被采纳积分+3

1回答

相似问题

请选择置顶位置

本课精华内容

Missing argument grant_type

MysqlTwistedPipline的对象没有cursor属性

知乎answer提取不到

为什么知乎数据导入不到MySQL数据库中？

运行 scrapy crawl jobbole 报错

【讨论题】你认为什么是 JS 逆向？

有没有方法可以比较准确的解析出 title 和正文内容

如何将数据的保存和抓取独立出来？

如何将 nodejs 服务集成进来呢？

【讨论题】字体反爬应该如何解析？

热搜

最近搜索清空