请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

Selenium 返回乱码

老师请问我在爬取期货网站的时候发现是动态加载的,就打算用selenium来爬取。不论是用id还是css选择器还是xpath,爬取出来的结果都是这样的,您看:
图片描述
请问是遇到反爬了吗?

正在回答 回答被采纳积分+3

3回答

提问者 FridericusRex 2021-04-03 17:18:43

老师我正则表达式可以提取出这个data后面的数值了,但是放到爬虫上面的话它显示“expected string or bytes-like object”,因为我这个Selector 取出的是selector list,而不是string类型,请问怎么办呢?https://img1.sycdn.imooc.com//szimg/606832e90932433a29781902.jpg

0 回复 有任何疑惑可以回复我~
  • 提问者 FridericusRex #1
    问题已解决:加上一个.extract()[0]
    回复 有任何疑惑可以回复我~ 2021-04-03 23:13:23
  • bobby 回复 提问者 FridericusRex #2
    好的、
    回复 有任何疑惑可以回复我~ 2021-04-05 19:47:39
提问者 FridericusRex 2021-04-03 16:04:44

谢谢老师,现在我内容已经可以爬下来了。但是请问我怎么单独吧这个data后面的数字取出呢?请问是要用上正则表达式吗?https://img1.sycdn.imooc.com//szimg/606821930908501127591547.jpg

0 回复 有任何疑惑可以回复我~
bobby 2021-03-22 11:50:48

这里是正确的 因为你使用的是selenium的find所以查询出来的元素类型是selenium的类型,当然不会是scrapy的类型了

0 回复 有任何疑惑可以回复我~
  • 提问者 FridericusRex #1
    那请问我怎么获得这个价格的数字呢?
    回复 有任何疑惑可以回复我~ 2021-03-24 18:35:50
  • bobby 回复 提问者 FridericusRex #2
    将selenium的page_source用于生产一个scrapy的selector对象 然后使用xpath来获取
    回复 有任何疑惑可以回复我~ 2021-03-25 11:46:40
问题已解决,确定采纳
还有疑问,暂不采纳
意见反馈 帮助中心 APP下载
官方微信