这个月(2018年12月)爬取去哪儿数据的时候,发现他们的网站做了一次更新,导致有些数据爬不到了.
这是我之前爬取的是好中差评数据,如图:
页面是这样的(不需要登陆):
http://hotel.qunar.com/city/shenzhen/dt-872/?tag=shenzhen
但是这个月,用selenium打开的页面却变成了这样:
ps: 动态运行Js,模拟浏览器下拉到底部,让页面多加载一段时间...这些办法我都试过了.
但就是在selenium加载不出来这些数据,可是手动打开浏览器却可以看到评论数.
除了评论相关的数据,js没有加载出来,其他的房型js数据却又能加载出来,所以并不是js没有加载,
问题: 也就是说手动打开浏览器能看到的数据,放在selenium却看不到了,如何解决这个问题呢?
带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎
了解课程