实战课程_慕课网

实现一个爬虫，还要突破哪些反爬的机制？

1.3k

题目描述

通过本章的学习，我们掌握了爬虫的一些基础知识，但实际工作中的爬虫开发比这个要复杂得多，除了本章我们学习的知识外，你还了解哪些我们需要掌握的知识？

除了 xpath，爬取数据还有哪些技巧呢？
遇到要登录的网站，该如何实现呢？
遇到要输入验证码的网站，该如何实现呢？
遇到访问 IP 限制的，该如何突破呢？
遇到目标网站频繁更新，该如何应对呢？

关键提炼

理解网络请求的基本原理：网络、服务器、TCP/IP 协议等；
xpath，pyQuery,BS4、正则表达式活学活用；
爬与反爬，持续迭代。

查看完整作业内容

我的作业

去发布

登录后即可发布作业，立即登录

全部作业

数据加载中...

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

扫描二维码
关注慕课网微信公众号