采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
当然远远不止。我们研究过从首页这样进来数据重复率非常高,可能要覆盖大量的用户会花很长的时间。我们可以采用用户id自增的技巧,不断把当前用户id+1来获得新的用户,并且作为新的种子。这样应该会在用户量上有显著提升。
老师昨天中午爬网站出现一小时左右的user页面访问不了,这个需要我们担心吗
如果浏览器也不能访问,那是对方的问题。如果只是禁掉爬虫,我们可能要做相应的应对,比如设置userAgent,以及cookie等,要具体来
登录后可查看更多问答,登录/注册
语法+分布式爬虫实战 为转型工程师量身打造
4.3k 14
1.3k 1
2.6k 1
1.7k 12
购课补贴联系客服咨询优惠详情
慕课网APP您的移动学习伙伴
扫描二维码关注慕课网微信公众号