请稍等 ...

405报错

import requests
 
url = " http://www.xiaomishu.com/app/download/"
 
headers = {
    # 'host': "akesudiqu.xiaomishu.com",
    'upgrade-insecure-requests': "1",
    'user-agent': "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36",
    }
while True:
    response = requests.request("GET", url, headers=headers)
 
    print(response.text)

老师您好，requests代码如上面，能一直运行不会封锁，这个请求的url是来自scrapy请求的link。

但是scrapy spider文件如下，就以运行就报405，

# -*- coding: utf-8 -*-
import scrapy
from scrapy.linkextractors import LinkExtractor
from scrapy.spiders import CrawlSpider, Rule
import re
from pybloom_live import BloomFilter
from scrapy.http import Request, FormRequest, HtmlResponse
 
download_bf = BloomFilter(1024*1024*16, 0.01)
 
 
class XiaomishuSpider(CrawlSpider):
    name = 'xiaomishu'
    start_url = 'http://www.xiaomishu.com/citylist/'
    pattern = re.compile(r'xiaomishu\.com/shop/\w{12}/', re.DOTALL)
 
    rules = (
        Rule(LinkExtractor(allow=r'xiaomishu', deny=(r'links.aspx', )),
             callback='parse_item', follow=True),
    )
 
    headers = {
        'upgrade-insecure-requests': "1",
        'user-agent': "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36",
    }
 
    def start_requests(self):
         
        yield scrapy.Request(self.start_url, headers=self.headers)
 
    def _requests_to_follow(self, response):
 
        if not isinstance(response, HtmlResponse):
            return
        seen = set()
        for n, rule in enumerate(self._rules):
            links = [l for l in rule.link_extractor.extract_links(response) if l not in seen]
            if links and rule.process_links:
                links = rule.process_links(links)
            for link in links:
                seen.add(link)
                r = Request(url=link.url, callback=self._response_downloaded, headers=self.headers)
                r.meta.update(rule=n, link_text=link.text)
                yield rule.process_request(r)
 
    def parse_item(self, response):
 
        result = self.pattern.findall(response.text)
        if len(result) >= 1:
            print(result)
            for res in result:
                try:
                    if res not in download_bf:
                        download_bf.add(res)
                        print(res)
                    else:
                        print('数据已存在')
                except ValueError:
                    pass

上面scrapy代码，报405的链接，都能带到requests那个代码里一直运行。不知道为什么scrapy里报405？

慕丝8011162 2018-05-17 17:38:26

源自：10-2 redis基础知识 - 1

1320

收起

提交取消

1回答

bobby 2018-05-18 14:45:54

如果你看过的生鲜电商的课程就会知道http的每个状态码都是有意义的 405就是方法出错比如你的一个url只能接收post方法你用get方法取访问就会出现405 反之也一样

0 回复有任何疑惑可以回复我~

收起回答

提问者慕丝8011162 #1
```
非常感谢！
```
回复有任何疑惑可以回复我~ 2018-05-18 15:57:06

提问者慕丝8011162 #2

找到原因了，不是请求方式不对，不是混用了get  post。把setting文件的cookie enable设置为True就可以了。不懂为什么这样就好了。

回复有任何疑惑可以回复我~ 2018-05-18 15:59:07

bobby 回复提问者慕丝8011162 #3
```
好的， 那应该是检查了cookie了
```
回复有任何疑惑可以回复我~ 2018-05-21 11:15:26

相似问题

405 Method Not Allowed

405

部署宝塔服务器nginx,请求接口报405

405报错

book数据可以拿到，前端渲染模块加载不出来，也没报错，浏览器一直卡着

登录后可查看更多问答，登录/注册

Scrapy打造搜索引擎畅销4年的Python分布式爬虫课

参与学习 5805 人
解答问题 6290 个

带你彻底掌握Scrapy，用Django+Elasticsearch搭建搜索引擎

了解课程

本课精华内容

问答作业

Missing argument grant_type

4.9k 30

MysqlTwistedPipline的对象没有cursor属性

2.6k 18

知乎answer提取不到

1.3k 18

为什么知乎数据导入不到MySQL数据库中？

1.5k 15

运行 scrapy crawl jobbole 报错

3.0k 15

查看更多本课问答

微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

405报错

正在回答

1回答

相似问题

请选择置顶位置

本课精华内容

Missing argument grant_type

MysqlTwistedPipline的对象没有cursor属性

知乎answer提取不到

为什么知乎数据导入不到MySQL数据库中？

运行 scrapy crawl jobbole 报错

【讨论题】你认为什么是 JS 逆向？

有没有方法可以比较准确的解析出 title 和正文内容

如何将数据的保存和抓取独立出来？

如何将 nodejs 服务集成进来呢？

【讨论题】字体反爬应该如何解析？

热搜

最近搜索清空

405报错

正在回答

1回答

相似问题

请选择置顶位置

本课精华内容

Missing argument grant_type

MysqlTwistedPipline的对象没有cursor属性

知乎answer提取不到

为什么知乎数据导入不到MySQL数据库中？

运行 scrapy crawl jobbole 报错

【讨论题】你认为什么是 JS 逆向？

有没有方法可以比较准确的解析出 title 和正文内容

如何将数据的保存和抓取独立出来？

如何将 nodejs 服务集成进来呢？

【讨论题】字体反爬应该如何解析？