采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
scrapy shell 在请求https://bbs.csdn.net/forums/ios 时返回如下图 添加headers,和cookies 还是无法返回正确热HTML
csdn的这里做了反爬 所以只使用scrapy shell不方便, 你使用selenium去请求并获取html就行了,因为这里csdn请求经过了两步才能完成, 第一步请求会返回一段js文本,js逻辑会再去请求一次,第二次才是html内容
非常感谢!
用scrapy爬取的话就必须将Sselenium集成到scrapy当中?
你想集成到什么地方去?
登录后可查看更多问答,登录/注册
带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎
4.8k 30
2.5k 18
1.1k 18
1.4k 15
2.8k 15