采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
老师你好,珍爱网不能这么爬了,导致学到爬虫这里学不动了,有什么办法可以解决么?
把fetcher改一下,加入cookie和user-agent。页面上获取内容正则表达不好弄了可以使用goquery。我觉得这些都不是重点,需要学习的是老师为什么这样写。特别是分布式中chan传递消息,让我真的开眼界。
有些遗憾我的课程开设以来,应该是带去了很多有规律的爬虫吧,对方网站最近加了反扒的机制,我们现有的方法不能用了。我们可以通过设置header的方法来缓解,不过对方仍然很好防范。目前来看,同学可以换一个网站去爬。找个新闻类的或者体育、金融类不用登陆的即可。
老师,你需要更新一下课程
不然无法爬取婚恋网站
登录后可查看更多问答,登录/注册
语法+分布式爬虫实战 为转型工程师量身打造
3.9k 14
804 1
2.2k 1
1.2k 12
购课补贴联系客服咨询优惠详情
慕课网APP您的移动学习伙伴
扫描二维码关注慕课网微信公众号