请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

cnblogs模拟登录出错错误

# -*- coding: utf-8 -*-
import multiprocessing

import scrapy
from scrapy import Selector



class JobboleSpider(scrapy.Spider):
    name = 'jobbole'
    allowed_domains = ['news.cnblogs.com']
    start_urls = ['http://news.cnblogs.com/']
    custom_settings = {
        "COOKIES_ENABLED": True
    }

    def start_requests(self):
        # 入口可以模拟登入拿到cookie,selenium控制浏览器会被一些网站识别出来例如知乎,拉勾
        import undetected_chromedriver.v2 as uc
        browser = uc.Chrome()
        browser.get("https://account.cnblogs.com/signin")
        print("_______________")
        # 自动化输入,自动化识别滑动验证码并拖动
        input("回车继续:")
        # 拿到cookie
        cookies = browser.get_cookies()
        cookie_dict = {}
        for cookie in cookies:
            cookie_dict[cookie['name']] = cookie['value']
        for url in self.start_urls:
            headers = {
                'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36'
            }
            # 将cookie交给scrapy, 后续的请求会请求之前的cooked吗?
            yield scrapy.Request("https://news.cnblogs.com/n/709266/", cookies=cookie_dict, headers=headers,dont_filter=True)

    def parse(self, response):

        sel = Selector(text=response.text)
        url1 = sel.css('#news_list h2 a::attr(href)').extract()
        url = response.css('#news_list h2 a::attr(href)').extract()
        pass

图片描述

正在回答 回答被采纳积分+3

1回答

bobby 2021-12-27 13:29:56

你这里是一启动爬虫就报错还是运行到某处之后报错?

0 回复 有任何疑惑可以回复我~
  • 提问者 魈仔 #1
    运行到这里就报错browser = uc.Chrome()
    回复 有任何疑惑可以回复我~ 2021-12-27 13:40:47
  • bobby 回复 提问者 魈仔 #2
    你留个qq 我加你看看
    回复 有任何疑惑可以回复我~ 2021-12-30 21:28:15
  • 提问者 魈仔 回复 bobby #3
    好的谢谢老师 2902615562
    回复 有任何疑惑可以回复我~ 2021-12-30 22:44:45
问题已解决,确定采纳
还有疑问,暂不采纳
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号