文章目录
- 前言
- [一、安装 Selenium](#一、安装 Selenium)
- 二、下载WebDriver
- 三、基本用法
- 总结
前言
今日老板给了一个Excel文件和一个表单录入网站,要求实现Excel的内容自动录入表单。这应该涉及自动化了吧,咱也不懂,开始搜吧,Selenium 是一个用于自动化 Web 浏览器操作的强大工具,广泛应用于 Web 应用程序测试、网页数据抓取和任务自动化等场景。Selenium 为各种编程语言提供了 API,用作测试。 目前的官方 API 文档有 C#、JavaScript、Java、Python、Ruby、Kotlin。
更多详情请移步Selenium官网
一、安装 Selenium
要开始使用 Selenium,首先需要安装 selenium 库,并下载适用于你浏览器的 WebDriver。
使用 pip 安装 Selenium:
python
pip install selenium
二、下载WebDriver
Selenium 需要一个 WebDriver 来与浏览器进行交互。
不同的浏览器需要不同的 WebDriver,例如 Chrome 浏览器需要 ChromeDriver,你需要根据你使用的浏览器下载相应的 WebDriver,并确保它在你的系统 PATH 中。
- Chrome: ChromeDriver
- Firefox: GeckoDriver
- Edge: EdgeDriver
本文以Edge为例,下载后点击安装如下
三、基本用法
1、打开网页
python
from selenium import webdriver
if __name__ == "__main__":
# 使用 Edge 浏览器
driver = webdriver.Edge()
driver.get("https://www.baidu.com")
通过命令python seleniumStudy.py运行,发现打开了Edge浏览器,并且成功打开了百度,但是几秒钟后就关闭了,原因是默认设置下Selenium会在完成所有操作后关闭浏览器。为防止这一情况,可以通过添加EdgeOptions的experimental_option,设置detach为True,使浏览器在脚本执行后保持打开状态。另外,也可以使用Options类来设置浏览器不关闭。
修改代码如下
python
if __name__ == "__main__":
# 获取浏览器配置
options = webdriver.EdgeOptions()
options.add_experimental_option('detach', True) # 保持浏览器不关闭
# 使用Edge浏览器
driver = webdriver.Edge(options)
# 打开网页
driver.get("https://www.baidu.com")
重新执行,正常。
2.查找页面元素
python
# 通过 ID 查找元素
search_box = driver.find_element("id", "kw")
# 通过类名查找元素
search_button = driver.find_element("class name", "s_ipt")
# 通过标签名查找元素
links = driver.find_elements("tag name", "a")
3.模拟用户操作
Selenium 可以模拟用户在浏览器中的操作,例如点击、输入文本等:
python
# 输入搜索内容
search_box.send_keys("Selenium Python")
# 提交搜索表单
search_box.send_keys(Keys.RETURN)
selenium 常用方法
方法 说明 示例代码
总结
以上就是Python selenium库的简单学习使用。至于excel如何操作,我们下一篇接着来学习。