请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

selenium 集成到scripy后,点击翻页问题

我parse里能正常采集值存了,原本的在parse里判断是否有下一页标签,再交个Request,callback=parse.,现在需要selenium来点击下一页按钮,怎么做呢?
我这样没成功图片描述
在browser.click()这就报错停了

正在回答 回答被采纳积分+3

4回答

提问者 haoliyou 2018-10-18 22:18:02


https://img1.sycdn.imooc.com//szimg/5bc895d70001b7c713010463.jpg   

改成xpath,后能翻到第二页,就还是报过滤重复就听了

0 回复 有任何疑惑可以回复我~
  • 提问者 haoliyou #1
    翻页click后,yield scrapy.Request(url=self.browser.current_url,)这个url是不是不这样写啊?哪里的问题啊?
    回复 有任何疑惑可以回复我~ 2018-10-18 22:49:35
  • bobby 回复 提问者 haoliyou #2
    你先分析一下请求 第一: 是不是url都相同 但是是post 只是参数不同而已,如果是这样 你在request中加上dont_filter=True防止过滤 第二点就要考虑 这个请求是不是异步请求,就是说这个请求是不是不会刷新页面,如果是这样那后台返回的应该就是json数据,这样你就可以独立处理json数据了
    回复 有任何疑惑可以回复我~ 2018-10-19 17:43:36
  • 提问者 haoliyou 回复 bobby #3
    老师你看下http://hotel.qunar.com/city/yaan/ 这个页面嘛,它的翻页和点击事件我都找不到线索,模仿了下拉,点击下一页,页面没有刷新,是post请求但没有json。纠结。。。。。
    回复 有任何疑惑可以回复我~ 2018-10-19 17:58:06
提问者 haoliyou 2018-10-18 21:48:33


https://img1.sycdn.imooc.com//szimg/5bc88eae0001bd7017750626.jpg 

日志显示是访问重复过滤了,这个是post动态的 不知道什么办法了

0 回复 有任何疑惑可以回复我~
提问者 haoliyou 2018-10-18 21:43:43

老师,http://hotel.qunar.com/city/yaan/ 这个页面有下拉又有js的下一页点击,怎么弄啊,试过css样式没有错,事件可能作用在li上,也可能在a上,都试过没成功。

0 回复 有任何疑惑可以回复我~
提问者 haoliyou 2018-10-18 20:50:10


https://img1.sycdn.imooc.com//szimg/5bc881400001747811280438.jpg

找了api,这样还是不行,能进if,click就报错死了

0 回复 有任何疑惑可以回复我~
  • bobby #1
    click只有有没有异常信息 截图我看看报错的异常
    回复 有任何疑惑可以回复我~ 2018-10-19 17:45:21
  • 提问者 haoliyou 回复 bobby #2
    这个报错应该是点击事件没有在a上,我改成li上就能到第二页,但就不能继续三叶,报重复过滤了
    回复 有任何疑惑可以回复我~ 2018-10-19 17:59:42
  • bobby 回复 提问者 haoliyou #3
    你加我qq 442421039
    回复 有任何疑惑可以回复我~ 2018-10-19 18:21:41
问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信