采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
http://www.jomashop.com/tissot-mens-watch-t0636171603700.html
这个网站查看源码发现不是js动态加载的页面
可是用xpath或者css都取不到任何东西
请问是什么原因
你打印一下html看看是否是你在浏览器里面看到的 会不是是因为网站判断是爬虫 给你返回了假数据
网站确实发现我是爬虫了 然后让我输入验证码 我用了你推荐的那个云打码 正确率特别低 他们客服说那种验证码就是正确率很低。 那我是不是就爬不了这个网站了
登录后可查看更多问答,登录/注册
带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎
4.8k 30
2.6k 18
1.2k 18
1.4k 15
2.8k 15