使用 Python Selenium 访问 HTML 源代码。
seleniumautomation testingtesting toolshtmlpython
我们可以使用 Selenium webdriver 访问 HTML 源代码。我们可以借助 page_source 方法并在控制台中打印从该方法获得的值。
语法
src = driver.page_source
我们还可以在 Selenium 中借助 Javascript 命令访问 HTML 源代码。我们将借助 execute_script 方法并将命令 return document.body.innerHTML 作为参数传递给该方法。
语法
h = driver.execute_script("return document.body.innerHTML;")
示例
代码实现。
from selenium import webdriver driver = webdriver.Chrome(executable_path="C:\chromedriver.exe") driver.implicitly_wait(0.5) driver.get("https://www.tutorialspoint.com/index.htm") # 使用 page_source 方法访问 HTML 源代码 s = driver.page_source print(s)
使用 Javascript Executor 实现代码。
from selenium import webdriver driver = webdriver.Chrome(executable_path="C:\chromedriver.exe") driver.implicitly_wait(0.5) driver.get("https://www.tutorialspoint.com/index.htm") # 使用 Javascript 命令访问 HTML 源代码 h = driver.execute_script("return document.body.innerHTML") print(h)