请稍等 ...
×

采纳答案成功!

向帮助你的同学说点啥吧!感谢那些助人为乐的人

page_source 打印出来仍然是网页源码

老师,我按照8-1章节的selenium的print(browser.page_source)打印出加载后的html页面,但是为什么print出来的仍然是和网页源码一样的html?

直接用selenium的browser.find_element_by_css_selector()函数,是可以定位到元素。

但是用Selector(text=browser.page_source)以后,无法定位元素,因为下载的不是渲染以后的html,下载的仍然是网页源码。https://img1.sycdn.imooc.com//szimg/5a9e3573000175cd09130388.jpg

正在回答

3回答

# !/usr/bin/env python
# encoding: utf-8
from selenium import webdriver
chrome_opt = webdriver.ChromeOptions()
prefs = {"profile.managed_default_content_settings.images":2}
chrome_opt.add_experimental_option("prefs", prefs)
browser = webdriver.Chrome(executable_path="E:/tmp/chromedriver.exe", chrome_options=chrome_opt)
browser.get("https://www.renrendai.com/loan/1")
import time
time.sleep(10)
html = browser.find_element_by_tag_name('html').get_attribute('innerHTML')
print(html)

我这里本地运行了这个url是没有问题的啊

0 回复 有任何疑惑可以回复我~
  • 提问者 Macrowz #1
    谢谢老师!
    回复 有任何疑惑可以回复我~ 2018-03-12 14:23:04
bobby 2018-03-08 10:12:15

你先在请求以后 sleep 几秒再获取源码试试呢

0 回复 有任何疑惑可以回复我~
  • 提问者 Macrowz #1
    老师,sleep了10秒以后,browser.page_source()仍然是未渲染的html。
    url是:“https://www.renrendai.com/loan/1”
    老师能不能看一下?
    回复 有任何疑惑可以回复我~ 2018-03-08 16:37:52
qq_小青年_18 2018-03-07 13:53:46

我这边使用之后打印出来的是网络请求之后完整数据

0 回复 有任何疑惑可以回复我~
  • 提问者 Macrowz #1
    请问你用的url是“www.renrendai.com/loan/1”吗?
    回复 有任何疑惑可以回复我~ 2018-03-07 14:47:12
问题已解决,确定采纳
还有疑问,暂不采纳
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号