请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

珍爱网改动了,不能用原来的办法爬了

老师你好,珍爱网不能这么爬了,导致学到爬虫这里学不动了,有什么办法可以解决么?

正在回答 回答被采纳积分+3

2回答

慕慕4062047 2019-09-24 11:10:41

把fetcher改一下,加入cookie和user-agent。页面上获取内容正则表达不好弄了可以使用goquery。我觉得这些都不是重点,需要学习的是老师为什么这样写。特别是分布式中chan传递消息,让我真的开眼界。

1 回复 有任何疑惑可以回复我~
ccmouse 2019-09-21 20:30:24

有些遗憾我的课程开设以来,应该是带去了很多有规律的爬虫吧,对方网站最近加了反扒的机制,我们现有的方法不能用了。我们可以通过设置header的方法来缓解,不过对方仍然很好防范。目前来看,同学可以换一个网站去爬。找个新闻类的或者体育、金融类不用登陆的即可。

0 回复 有任何疑惑可以回复我~
  • 老师,你需要更新一下课程
    回复 有任何疑惑可以回复我~ 2019-09-27 04:37:56
  • 不然无法爬取婚恋网站
    回复 有任何疑惑可以回复我~ 2019-09-27 04:38:20
问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信