采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
老师您好,我用chrome driver 爬取国外某游戏数据网站https://steamdb.info/sales/,chrome driver总是被识别到,然后弹出验证码页面,请问有什么配置可以防止被识别?
主要是控制速度, 你将速度控制下来 随机时间去请求 不要固定时间间隔
这个网站第一次发起请求就会被识别,应该与速度无关,有别的识别可能吗?比如Chrome driver的一些js文件特征?
chromedriver确实有一些特殊可能会被js识别出来 你这里的chrome版本是多少,我之前发现chrome60版本以及以下的driver最不容易识别出来
用的是项目源码中提供的版本,我后面再尝试一下用低版本。不过请问主要是哪些特征被识别出来了呢?有什么办法可以伪装吗?我记得之前老师你在某个问题中说是可以改driver的某个配置,但是找不到相关问答了。
登录后可查看更多问答,登录/注册
带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎
4.9k 30
2.7k 18
1.3k 18
1.5k 15
3.0k 15
购课补贴联系客服咨询优惠详情
慕课网APP您的移动学习伙伴
扫描二维码关注慕课网微信公众号