Python selenium库学习使用实操

文章目录


前言

今日老板给了一个Excel文件和一个表单录入网站,要求实现Excel的内容自动录入表单。这应该涉及自动化了吧,咱也不懂,开始搜吧,Selenium 是一个用于自动化 Web 浏览器操作的强大工具,广泛应用于 Web 应用程序测试、网页数据抓取和任务自动化等场景。Selenium 为各种编程语言提供了 API,用作测试。 目前的官方 API 文档有 C#、JavaScript、Java、Python、Ruby、Kotlin。

更多详情请移步Selenium官网


一、安装 Selenium

要开始使用 Selenium,首先需要安装 selenium 库,并下载适用于你浏览器的 WebDriver。

使用 pip 安装 Selenium:

python 复制代码
pip install selenium

二、下载WebDriver

Selenium 需要一个 WebDriver 来与浏览器进行交互。

不同的浏览器需要不同的 WebDriver,例如 Chrome 浏览器需要 ChromeDriver,你需要根据你使用的浏览器下载相应的 WebDriver,并确保它在你的系统 PATH 中。

本文以Edge为例,下载后点击安装如下

三、基本用法

1、打开网页

python 复制代码
from selenium import webdriver


if __name__ == "__main__":
    # 使用 Edge 浏览器
    driver = webdriver.Edge()
    driver.get("https://www.baidu.com")

通过命令python seleniumStudy.py运行,发现打开了Edge浏览器,并且成功打开了百度,但是几秒钟后就关闭了,原因是默认设置下Selenium会在完成所有操作后关闭浏览器。为防止这一情况,可以通过添加EdgeOptions的experimental_option,设置detach为True,使浏览器在脚本执行后保持打开状态。另外,也可以使用Options类来设置浏览器不关闭。

修改代码如下

python 复制代码
if __name__ == "__main__":
    # 获取浏览器配置
    options = webdriver.EdgeOptions()
    options.add_experimental_option('detach', True) # 保持浏览器不关闭

    # 使用Edge浏览器
    driver = webdriver.Edge(options)
    # 打开网页
    driver.get("https://www.baidu.com")

重新执行,正常。

2.查找页面元素

python 复制代码
# 通过 ID 查找元素
search_box = driver.find_element("id", "kw")
# 通过类名查找元素
search_button = driver.find_element("class name", "s_ipt")
# 通过标签名查找元素
links = driver.find_elements("tag name", "a")

3.模拟用户操作

Selenium 可以模拟用户在浏览器中的操作,例如点击、输入文本等:

python 复制代码
    # 输入搜索内容
    search_box.send_keys("Selenium Python")
    # 提交搜索表单
    search_box.send_keys(Keys.RETURN)


selenium 常用方法

方法 说明 示例代码

总结

以上就是Python selenium库的简单学习使用。至于excel如何操作,我们下一篇接着来学习。

相关推荐
smj2302_7968265223 分钟前
解决leetcode第3911题.移除子数组元素后第k小偶数
数据结构·python·算法·leetcode
大势智慧44 分钟前
矿影智测版|矿山自动化测绘,省时精准更省心!
自动化·三维建模·智慧矿山·安全巡检·空间智能··露天矿山
酿情师1 小时前
yihan:一款面向连续网页学习的智能侧边栏插件
学习·学习方法·工具·学习工具
阿正呀1 小时前
Redis怎样实现本地缓存的高效失效通知
jvm·数据库·python
2501_901200531 小时前
mysql如何设置InnoDB引擎参数_优化innodb_buffer_pool
jvm·数据库·python
_.Switch1 小时前
东方财富股票数据JS逆向:secids字段和AES加密实战
开发语言·前端·javascript·网络·爬虫·python·ecmascript
Mr_sst2 小时前
Claude Code 部署与使用保姆级教程(2026 最新)
python·ai
瞎某某Blinder2 小时前
DFT学习记录[6]基于 HES06的能带计算+有效质量计算
python·学习·程序人生·数据挖掘·云计算·学习方法
m0_495496412 小时前
mysql处理复杂SQL性能_InnoDB优化器与MyISAM差异
jvm·数据库·python
love在水一方3 小时前
VLN 入门学习计划 —— 基于 InternNav
学习