Python selenium库学习使用实操

文章目录


前言

今日老板给了一个Excel文件和一个表单录入网站,要求实现Excel的内容自动录入表单。这应该涉及自动化了吧,咱也不懂,开始搜吧,Selenium 是一个用于自动化 Web 浏览器操作的强大工具,广泛应用于 Web 应用程序测试、网页数据抓取和任务自动化等场景。Selenium 为各种编程语言提供了 API,用作测试。 目前的官方 API 文档有 C#、JavaScript、Java、Python、Ruby、Kotlin。

更多详情请移步Selenium官网


一、安装 Selenium

要开始使用 Selenium,首先需要安装 selenium 库,并下载适用于你浏览器的 WebDriver。

使用 pip 安装 Selenium:

python 复制代码
pip install selenium

二、下载WebDriver

Selenium 需要一个 WebDriver 来与浏览器进行交互。

不同的浏览器需要不同的 WebDriver,例如 Chrome 浏览器需要 ChromeDriver,你需要根据你使用的浏览器下载相应的 WebDriver,并确保它在你的系统 PATH 中。

本文以Edge为例,下载后点击安装如下

三、基本用法

1、打开网页

python 复制代码
from selenium import webdriver


if __name__ == "__main__":
    # 使用 Edge 浏览器
    driver = webdriver.Edge()
    driver.get("https://www.baidu.com")

通过命令python seleniumStudy.py运行,发现打开了Edge浏览器,并且成功打开了百度,但是几秒钟后就关闭了,原因是默认设置下Selenium会在完成所有操作后关闭浏览器。为防止这一情况,可以通过添加EdgeOptions的experimental_option,设置detach为True,使浏览器在脚本执行后保持打开状态。另外,也可以使用Options类来设置浏览器不关闭。

修改代码如下

python 复制代码
if __name__ == "__main__":
    # 获取浏览器配置
    options = webdriver.EdgeOptions()
    options.add_experimental_option('detach', True) # 保持浏览器不关闭

    # 使用Edge浏览器
    driver = webdriver.Edge(options)
    # 打开网页
    driver.get("https://www.baidu.com")

重新执行,正常。

2.查找页面元素

python 复制代码
# 通过 ID 查找元素
search_box = driver.find_element("id", "kw")
# 通过类名查找元素
search_button = driver.find_element("class name", "s_ipt")
# 通过标签名查找元素
links = driver.find_elements("tag name", "a")

3.模拟用户操作

Selenium 可以模拟用户在浏览器中的操作,例如点击、输入文本等:

python 复制代码
    # 输入搜索内容
    search_box.send_keys("Selenium Python")
    # 提交搜索表单
    search_box.send_keys(Keys.RETURN)


selenium 常用方法

方法 说明 示例代码

总结

以上就是Python selenium库的简单学习使用。至于excel如何操作,我们下一篇接着来学习。

相关推荐
吃好睡好便好3 分钟前
泰戈尔的诗歌6
学习·生活
双吉堡4 分钟前
北京通州有哪些热门且专业的学画画画室?
学习
huangjiazhi_7 分钟前
Python3.14编写文件服务器
python
郭梧悠17 分钟前
算法:有效的括号
python·算法·leetcode
佛珠散了一地24 分钟前
ONNX Runtime GPU 推理配置指南
python
派葛穆1 小时前
Python-pip切换镜像源
开发语言·python·pip
CTA终结者1 小时前
2026年AI量化提效,工具重点要按阶段调整
人工智能·python
Go-higher1 小时前
DriverTest 驾考知识卡片学习助手 —— 一款基于 Jetpack Compose 的现代 Android 学习APP
android·学习
xxie1237941 小时前
Python 闭包:函数嵌套的 “状态捕获” 机制
开发语言·python
梦想的旅途21 小时前
基于RPA技术的企业微信自动化接口设计思路与应用实践
人工智能·机器人·自动化·企业微信·rpa