采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
你应该是想抓百度文库这种网页的内容吧 https://blog.csdn.net/weixin_44510615/article/details/107694231 看看这个试试
是内网的系统,而且只能用ie浏览器才能加载插件,我疑惑的是,连数据都没有返回,F12返回的数据我都看了,没有一个是有对应数据的,连文件都没有。 也不知道原理是不是直接把文档加载到网页,弄了一天都没弄到,很疑惑
插件可以自己走tcp协议, 你的浏览器只能抓取到http协议, 所以这个是正常的, 可以试试wireshark抓tcp包
登录后可查看更多问答,登录/注册
带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎
4.8k 30
2.5k 18
1.1k 18
1.4k 15
2.8k 15