采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
是否应该考虑下是否是首次登录呢,按照当前的逻辑,例如首次登录不需要输入验证码登录成功了,但是依然会进入while循环判断,但此时走到验证码识别部分,会导致报错使程序崩溃退出,如果在调用browser.get时就先判断能不能获取登录页后的标记元素,根据获取情况再判断,能获取直接return 进入parse函数,如果不能说明是登录页面,使其继续执行登录那一套流程,这样考虑可以吗?
通过browser.get之后判断是否已经登录了这种做法不好,因为每次启动selenium都是一个新的没有cookie历史的浏览器,除非采用远程连接到chrome的方式才可行,所以一般都是将cookie保存在文件中,启动之前加载cookie并使用这个cookie访问一下首页看看是否已经登录了
老师,还有一个比较明显的问题是我在debug时进入到parse函数时虽然可以获取到url,但是此时chrome浏览器知乎页面会闪退,这种情况正常吗?而且我保存在本地文件的cookie是乱码的这种情况有影响吗?
cookie只要能用,保存到文件中是乱码可以不用管,debug闪退有点奇怪,如果不debug会闪退吗?
登录后可查看更多问答,登录/注册
带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎
5.3k 30
2.9k 18
1.6k 18
1.8k 15
3.4k 15
购课补贴联系客服咨询优惠详情
慕课网APP您的移动学习伙伴
扫描二维码关注慕课网微信公众号