Python selenium 库
Selenium 是一个用于自动化 Web 浏览器操作的强大工具,广泛应用于 Web 应用程序测试、网页数据抓取和任务自动化等场景。
Selenium 为各种编程语言提供了 API,用作测试。 目前的官方 API 文档有 C#、JavaScript、Java、Python、Ruby。
Selenium 官网:https://www.fxku.cn/a/9/.php
Selenium 是一个用于自动化 Web 浏览器操作的强大工具,广泛应用于 Web 应用程序测试、网页数据抓取和任务自动化等场景。
Selenium 为各种编程语言提供了 API,用作测试。 目前的官方 API 文档有 C#、JavaScript、Java、Python、Ruby。
Selenium 官网:https://www.fxku.cn/a/9/.php
要开始使用 Selenium,首先需要安装 selenium 库,并下载适用于你浏览器的 WebDriver。
使用 pip 安装 Selenium:
pip install selenium
Selenium 需要一个 WebDriver 来与浏览器进行交互。
不同的浏览器需要不同的 WebDriver,例如 Chrome 浏览器需要 ChromeDriver,你需要根据你使用的浏览器下载相应的 WebDriver,并确保它在你的系统 PATH 中。
选择浏览器并初始化 WebDriver:
使用 get() 方法打开网页:
driver.get("https://www.baidu.com")
Selenium 可以模拟用户在浏览器中的操作,例如点击、输入文本等:
可以获取页面元素的属性值或文本内容:
有时页面加载需要时间,可以使用显式等待或隐式等待来确保元素可操作:
操作完成后,记得关闭浏览器:
driver.quit()
下面是一个简单的 Selenium 项目示例,用于自动化搜索关键词,并获取结果页面的标题。
下表列出了 selenium 库的常用方法:
方法 | 说明 | 示例代码 |
---|---|---|
webdriver.Chrome() | 初始化 Chrome 浏览器实例。 | driver = webdriver.Chrome() |
driver.get(url) | 访问指定的 URL 地址。 | driver.get("https://example.com") |
driver.find_element(By, value) | 查找第一个匹配的元素。 | element = driver.find_element(By.ID, "id") |
driver.find_elements(By, value) | 查找所有匹配的元素。 | elements = driver.find_elements(By.CLASS_NAME, "class") |
element.click() | 点击元素。 | element.click() |
element.send_keys(value) | 向输入框中发送键盘输入。 | element.send_keys("text") |
element.text | 获取元素的文本内容。 | text = element.text |
driver.back() | 浏览器后退。 | driver.back() |
driver.forward() | 浏览器前进。 | driver.forward() |
driver.refresh() | 刷新当前页面。 | driver.refresh() |
driver.execute_script(script, *args) | 执行 JavaScript 脚本。 | driver.execute_script("alert('Hello!')") |
driver.switch_to.frame(frame_reference) | 切换到指定的 iframe。 | driver.switch_to.frame("frame_id") |
driver.switch_to.default_content() | 切换回主文档。 | driver.switch_to.default_content() |
driver.quit() | 关闭浏览器并退出驱动。 | driver.quit() |
driver.close() | 关闭当前窗口。 | driver.close() |