Python selenium库学习使用实操

文章目录


前言

今日老板给了一个Excel文件和一个表单录入网站,要求实现Excel的内容自动录入表单。这应该涉及自动化了吧,咱也不懂,开始搜吧,Selenium 是一个用于自动化 Web 浏览器操作的强大工具,广泛应用于 Web 应用程序测试、网页数据抓取和任务自动化等场景。Selenium 为各种编程语言提供了 API,用作测试。 目前的官方 API 文档有 C#、JavaScript、Java、Python、Ruby、Kotlin。

更多详情请移步Selenium官网


一、安装 Selenium

要开始使用 Selenium,首先需要安装 selenium 库,并下载适用于你浏览器的 WebDriver。

使用 pip 安装 Selenium:

python 复制代码
pip install selenium

二、下载WebDriver

Selenium 需要一个 WebDriver 来与浏览器进行交互。

不同的浏览器需要不同的 WebDriver,例如 Chrome 浏览器需要 ChromeDriver,你需要根据你使用的浏览器下载相应的 WebDriver,并确保它在你的系统 PATH 中。

本文以Edge为例,下载后点击安装如下

三、基本用法

1、打开网页

python 复制代码
from selenium import webdriver


if __name__ == "__main__":
    # 使用 Edge 浏览器
    driver = webdriver.Edge()
    driver.get("https://www.baidu.com")

通过命令python seleniumStudy.py运行,发现打开了Edge浏览器,并且成功打开了百度,但是几秒钟后就关闭了,原因是默认设置下Selenium会在完成所有操作后关闭浏览器。为防止这一情况,可以通过添加EdgeOptions的experimental_option,设置detach为True,使浏览器在脚本执行后保持打开状态。另外,也可以使用Options类来设置浏览器不关闭。

修改代码如下

python 复制代码
if __name__ == "__main__":
    # 获取浏览器配置
    options = webdriver.EdgeOptions()
    options.add_experimental_option('detach', True) # 保持浏览器不关闭

    # 使用Edge浏览器
    driver = webdriver.Edge(options)
    # 打开网页
    driver.get("https://www.baidu.com")

重新执行,正常。

2.查找页面元素

python 复制代码
# 通过 ID 查找元素
search_box = driver.find_element("id", "kw")
# 通过类名查找元素
search_button = driver.find_element("class name", "s_ipt")
# 通过标签名查找元素
links = driver.find_elements("tag name", "a")

3.模拟用户操作

Selenium 可以模拟用户在浏览器中的操作,例如点击、输入文本等:

python 复制代码
    # 输入搜索内容
    search_box.send_keys("Selenium Python")
    # 提交搜索表单
    search_box.send_keys(Keys.RETURN)


selenium 常用方法

方法 说明 示例代码

总结

以上就是Python selenium库的简单学习使用。至于excel如何操作,我们下一篇接着来学习。

相关推荐
明月_清风4 小时前
Python 内存手术刀:sys.getrefcount 与引用计数的生死时速
后端·python
明月_清风4 小时前
Python 消失的内存:为什么 list=[] 是新手最容易踩的“毒苹果”?
后端·python
Flittly19 小时前
【从零手写 ClaudeCode:learn-claude-code 项目实战笔记】(3)TodoWrite (待办写入)
python·agent
千寻girling1 天前
一份不可多得的 《 Django 》 零基础入门教程
后端·python·面试
databook1 天前
探索视觉的边界:用 Manim 重现有趣的知觉错觉
python·动效
明月_清风1 天前
Python 性能微观世界:列表推导式 vs for 循环
后端·python
明月_清风1 天前
Python 性能翻身仗:从 O(n) 到 O(1) 的工程实践
后端·python
helloweilei2 天前
python 抽象基类
python
用户8356290780512 天前
Python 实现 PPT 转 HTML
后端·python
zone77392 天前
004:RAG 入门-LangChain读取PDF
后端·python·面试