采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
老师,超级鹰打码,我这样设置的 每次判断网站是否验证码网站,是的情况下,做打码处理,但是每次打码成功之后,又重新打开了验证码url,这个怎么解决呢,代码需要哪里改进吗,就是不会再进行下一个页面的reqs了
你是说你命名打码成功了 但是下一次去请求仍然会返回这个? 你是否启动了cookie 如果你登录成功了 记得重新yield一下 并设置好cookie 不然登录没用 主要是拿到cookie并让后续 所有的请求都拿到这个cookie
还是不行诶,我都带cookie,重新请求了yield,还是一直反复出来那个验证码网页。。老师你遇到那种爬取次数过多的时候,出现的验证码是怎么解决的呢,是在middlewares里面,就判断如果是302的验证码状态,就直接在那边处理吗??? middlewares那边处理302状态码,在去交给超级英打码,这个我不会诶,好难理解,老师可以告知具体怎么操作吗
测试了下出验证码后,只访问二个网站,他是yield之后 连续二次出验证码,然后在一起返回,是异步的,忘记了。。。。我现在这样写,就是他先全部判断是验证码网站。然后在去解码,一次性全部遍历解码后,在重新去访问。。。。。。。这样的话,太麻烦了。 是不是在middle里面配置,只需要一次验证码,就可以了。。。。老师,这个我不会。。。看了之前课程源码,知道在那边,但是不知道怎么弄。。网上也找不到教程。。。
你留下qq我加你看看
登录后可查看更多问答,登录/注册
带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎
4.9k 30
2.6k 18
1.2k 18
1.5k 15
2.9k 15
购课补贴联系客服咨询优惠详情
慕课网APP您的移动学习伙伴
扫描二维码关注慕课网微信公众号