采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
我parse里能正常采集值存了,原本的在parse里判断是否有下一页标签,再交个Request,callback=parse.,现在需要selenium来点击下一页按钮,怎么做呢? 我这样没成功 在browser.click()这就报错停了
改成xpath,后能翻到第二页,就还是报过滤重复就听了
翻页click后,yield scrapy.Request(url=self.browser.current_url,)这个url是不是不这样写啊?哪里的问题啊?
你先分析一下请求 第一: 是不是url都相同 但是是post 只是参数不同而已,如果是这样 你在request中加上dont_filter=True防止过滤 第二点就要考虑 这个请求是不是异步请求,就是说这个请求是不是不会刷新页面,如果是这样那后台返回的应该就是json数据,这样你就可以独立处理json数据了
老师你看下http://hotel.qunar.com/city/yaan/ 这个页面嘛,它的翻页和点击事件我都找不到线索,模仿了下拉,点击下一页,页面没有刷新,是post请求但没有json。纠结。。。。。
日志显示是访问重复过滤了,这个是post动态的 不知道什么办法了
老师,http://hotel.qunar.com/city/yaan/ 这个页面有下拉又有js的下一页点击,怎么弄啊,试过css样式没有错,事件可能作用在li上,也可能在a上,都试过没成功。
找了api,这样还是不行,能进if,click就报错死了
click只有有没有异常信息 截图我看看报错的异常
这个报错应该是点击事件没有在a上,我改成li上就能到第二页,但就不能继续三叶,报重复过滤了
你加我qq 442421039
登录后可查看更多问答,登录/注册
带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎
4.8k 30
2.5k 18
1.1k 18
1.4k 15
2.8k 15