【Python爬虫基础篇】--4.Selenium入门详细教程

先解释:Selenium:n.硒;硒元素

目录

1.Selenium--简介

2.Selenium--原理

3.Selenium--环境搭建

4.Selenium--简单案例

5.Selenium--定位方式

6.Selenium--常用方法

6.1.控制操作

6.2.鼠标操作

6.3.键盘操作

6.4.获取断言信息

6.5.多表单切换

6.6.多窗口切换

6.7.警告处理

6.8.下拉框

6.9.文件上传

6.10.cookie操作

6.11.窗口截图


1.Selenium--简介

Selenium 是一种开源工具,用于在 Web 浏览器上执行自动化测试(使用任何 Web 浏览器进行 Web 应用程序测试)。提供一套测试函数,用于支持Web自动化测试。函数非常灵活,能够完成界面元素定位、窗口跳转、结果比较。重申一下,Selenium 仅可以测试Web应用程序。我们既不能使用 Selenium 测试任何桌面(软件)应用程序,也不能测试任何移动应用程序。

具有如下特点:

  • 多浏览器支持
    • 如IE、Firefox、Safari、Chrome、Android手机浏览器等。
  • 支持多语言
    • 如Java、C#、Python、Ruby、PHP等。
  • 支持多操作系统
    • 如Windows、Linux、IOS、Android等。
  • 开源免费

2.Selenium--原理

将 WebDriver 驱动浏览器类比成开出租车的场景。

在开出租车时有三个角色

  • **乘客:**他/她告诉出租车司机去哪里,大概怎么走。

  • **出租车司机:**他按照乘客的要求来操控出租车。

  • **出租车:**出租车按照司机的操控完成真正的行驶,把乘客送到目的地。

在WebDriver中也有类似的三个角色:

  • 工程师写的自动化测试代码:自动化测试代码发送请求给浏览器的驱动(比如火狐驱动、谷歌驱动)
  • 浏览器的驱动:它来解析这些自动化测试的代码,解析后把它们发送给浏览器
  • 浏览器:执行浏览器驱动发来的指令,并最终完成工程师想要的操作。

3.Selenium--环境搭建

以谷歌浏览器为例子:

先确定谷歌浏览器版本,打开浏览器,点击帮助、关于Google Chrome

下载谷歌浏览器对应版本驱动

旧版本下载地址:http://chromedriver.storage.googleapis.com/index.html

CNPM Binaries Mirror

新版本下载地址: Chrome for Testing availability

下载解压后设置浏览器驱动

设置浏览器的地址非常简单。 我们可以手动创建一个存放浏览器驱动的目录,如: C:\driver , 将下载的浏览器驱动文件(例如:chromedriver、geckodriver)丢到该目录下。

我的电脑-->属性-->系统设置-->高级-->环境变量-->系统变量-->Path,将"C:\driver"目录添加到Path的值中。

我的实验使用的是edge浏览器,下载地址:Microsoft Edge WebDriver | Microsoft Edge Developer

验证一下:

python 复制代码
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.edge.service import Service
from selenium.webdriver.edge.options import Options
import pandas as pd
import time

# 设置Edge浏览器选项
edge_options = Options()
edge_options.add_argument("--headless")  # 无头模式,不显示浏览器窗口
edge_options.add_argument("--disable-gpu")
edge_options.add_argument("--window-size=1920,1080")

# 指定Edge驱动路径(需要先下载对应版本的Edge驱动)
# 下载地址:https://developer.microsoft.com/en-us/microsoft-edge/tools/webdriver/
edge_service = Service('D:\桌面文件\edgedriver_win64\msedgedriver.exe')  # 替换为你的Edge驱动路径

# 启动Edge浏览器
driver = webdriver.Edge(service=edge_service, options=edge_options)
url = "https://www.example.com"
driver.get(url)
# 获取网页标题
print(driver.title)

4.Selenium--简单案例

使用edge浏览器打开百度,搜索'西南石油大学',返回结果

首先需要找到:

1.百度搜索框的标签组件

2.'搜索'按键

搜索框的xpath: //*[@id="kw"]

搜索按钮的://*[@id="su"]

python 复制代码
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.edge.service import Service
from selenium.webdriver.edge.options import Options
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

# 配置浏览器选项
edge_options = Options()
edge_options.add_argument("--headless")
edge_options.add_argument("--disable-gpu")
edge_options.add_argument("--window-size=1920,1080")
edge_options.add_argument(
    "user-agent=Mozilla/5.0  (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/123.0.0.0 Safari/537.36")

# 启动浏览器
edge_service = Service(r"D:\桌面文件\edgedriver_win64\msedgedriver.exe")
driver = webdriver.Edge(service=edge_service, options=edge_options)

try:
    # 访问百度并搜索
    driver.get('https://www.baidu.com')
    driver.find_element(By.XPATH, '//*[@id="kw"]').send_keys('西南石油大学')
    driver.find_element(By.XPATH, '//*[@id="su"]').click()

    # 显式等待搜索结果加载
    WebDriverWait(driver, 10).until(
        EC.presence_of_element_located((By.ID, "content_left"))
    )

    # 保存源码到文件
    with open("search_result.html", "w", encoding="utf-8") as f:
        f.write(driver.page_source)
    print("源码已保存至 search_result.html")

finally:
    driver.quit()

打开页面:

5.Selenium--定位方式

通过driver.find_element方法定位之后找到的元素对象就是 WebElement 类型。

方法/属性 说明 典型应用场景 示例代码
clear() 清除输入框、文本域中的内容 清空搜索框、表单输入栏 element.clear()
send_keys(value) 向输入框或可编辑元素模拟键盘输入(支持字符串或组合键) 填写用户名、密码、搜索词 element.send_keys("test")
click() 模拟鼠标单击操作 点击按钮、链接、复选框 element.click()
submit() 提交表单(适用于表单元素或通过回车键提交的场景) 搜索框无按钮时替代回车提交 element.submit()
size 返回元素的尺寸字典 {'width': 宽, 'height': 高}(单位:像素) 验证UI布局或元素大小 print(element.size['width'])
text 获取元素的可见文本(包括子元素的文本) 提取页面显示的标题、提示信息 print(element.text)
get_attribute(name) 获取元素的属性值(如 hrefclassvalue 等) 获取链接地址、CSS类名、隐藏字段值 element.get_attribute("href")
定位方式 描述 示例
id 通过元素的唯一ID属性定位 driver.find_element(By.ID, "username")
name 通过元素的name属性定位 driver.find_element(By.NAME, "password")
class name 通过元素的class属性定位(多个元素可能共享相同class) driver.find_element(By.CLASS_NAME, "btn-submit")
tag name 通过HTML标签名定位(如<div><a>,通常需结合其他条件) driver.find_element(By.TAG_NAME, "input")
link text 通过超链接的完整文本内容定位(仅适用于<a>标签) driver.find_element(By.LINK_TEXT, "点击登录")
partial link text 通过超链接的部分文本内容定位(模糊匹配) driver.find_element(By.PARTIAL_LINK_TEXT, "登录")
xpath 通过XML路径表达式定位,支持复杂层级和属性组合 driver.find_element(By.XPATH, "//input[@type='text']")
css selector 通过CSS选择器定位,语法简洁且性能优于XPath driver.find_element(By.CSS_SELECTOR, "#login .submit-btn")

假如我们有一个Web页面,通过前端工具(如,Firebug)查看到一个元素的属性是这样的。

html 复制代码
<html>
  <head>
  <body link="#0000cc">
    <a id="result_logo" href="/" onmousedown="return c({'fm':'tab','tab':'logo'})">
    <form id="form" class="fm" name="f" action="/s">
      <span class="soutu-btn"></span>
        <input id="kw" class="s_ipt" name="wd" value="" maxlength="255" autocomplete="off">
html 复制代码
<a class="mnav" href="http://news.baidu.com" name="tj_trnews">新闻</a>
<a class="mnav" href="http://www.hao123.com" name="tj_trhao123">hao123</a>
定位方式 代码示例 适用场景
ID定位 driver.find_element(By.ID, "kw") 通过唯一ID定位,速度快且稳定(适用于静态或动态但ID唯一的元素)。
Name定位 driver.find_element(By.NAME, "wd") 通过name属性定位,常用于表单输入框、按钮等。
Class Name定位 driver.find_element(By.CLASS_NAME, "s_ipt") 通过class属性定位,需注意class可能重复(建议结合其他属性)。
Tag Name定位 driver.find_element(By.TAG_NAME, "input") 通过标签名定位(如<input>),通常需结合层级或属性过滤。
XPath定位 driver.find_element(By.XPATH, "//input[@id='kw']") 灵活性强,支持复杂路径、属性组合和逻辑表达式(如and/or)。
CSS Selector定位 driver.find_element(By.CSS_SELECTOR, "#kw") 语法简洁,性能优于XPath,支持层级、伪类等(如input.s_ipt)。
Link Text定位 driver.find_element(By.LINK_TEXT, "新闻") 精确匹配超链接的完整文本(如<a>新闻</a>)。
Partial Link Text driver.find_element(By.PARTIAL_LINK_TEXT, "新") 模糊匹配链接文本(如"新闻"可匹配"新"或"闻")。
  • 通过xpath定位,xpath定位有N种写法,这里列几个常用写法:
python 复制代码
dr.find_element_by_xpath("//*[@id='kw']")
dr.find_element_by_xpath("//*[@name='wd']")
dr.find_element_by_xpath("//input[@class='s_ipt']")
dr.find_element_by_xpath("/html/body/form/span/input")
dr.find_element_by_xpath("//span[@class='soutu-btn']/input")
dr.find_element_by_xpath("//form[@id='form']/span/input")
dr.find_element_by_xpath("//input[@id='kw' and @name='wd']")
  • 通过css定位,css定位有N种写法,这里列几个常用写法:
python 复制代码
dr.find_element_by_css_selector("#kw")
dr.find_element_by_css_selector("[name=wd]")
dr.find_element_by_css_selector(".s_ipt")
dr.find_element_by_css_selector("html > body > form > span > input")
dr.find_element_by_css_selector("span.soutu-btn> input#kw")
dr.find_element_by_css_selector("form#form > span > input")

6.Selenium--常用方法

6.1.控制操作

方法 说明 典型应用场景
set_window_size(width, height) 设置浏览器窗口尺寸(像素单位) 测试响应式布局时模拟不同设备分辨率(如set_window_size(1280, 720))。
back() 模拟浏览器后退按钮操作 测试页面导航逻辑(如从详情页返回列表页)。
forward() 模拟浏览器前进按钮操作 验证用户通过前进/后退功能是否能恢复历史状态。
refresh() 刷新当前页面 测试数据重新加载或表单重置逻辑。
clear() 清除输入框的文本内容 表单测试中先清空旧值再输入新值(如搜索框)。
send_keys(value) 向输入框模拟键盘输入(支持字符串或组合键) 输入用户名、密码或快捷键操作(如Keys.ENTER提交)。
click() 单击页面元素(按钮、链接等) 触发交互事件(如提交按钮、下拉菜单)。
submit() 提交表单(适用于<form>标签内的元素) 替代click()直接提交表单数据(需元素在form内)。
get_attribute(name) 获取元素属性值(如hrefvalue 验证动态生成的属性(如超链接地址或数据绑定值)。
is_displayed() 检查元素是否可见(返回布尔值) 验证弹窗、广告是否正常展示或隐藏。
size 返回元素的尺寸(widthheight,单位像素) 测试UI布局是否符合设计规范(如按钮大小)。
text 获取元素的可见文本内容(不包括隐藏文本) 验证页面提示信息或动态加载的文本内容。
python 复制代码
from selenium import webdriver

from time import sleep
#1.创建Chrome浏览器对象,这会在电脑上在打开一个浏览器窗口
browser = webdriver.Firefox(executable_path ="F:\GeckoDriver\geckodriver")

#2.通过浏览器向服务器发送URL请求
browser.get("https://www.baidu.com/")

sleep(3)

#3.刷新浏览器
browser.refresh()

#4.设置浏览器的大小
browser.set_window_size(1400,800)

#5.设置链接内容
element=browser.find_element_by_link_text("新闻")
element.click()

element=browser.find_element_by_link_text(""下团组"时间")
element.click()

6.2.鼠标操作

方法 说明 代码示例(Selenium 4+)
ActionChains(driver) 创建鼠标操作链对象 actions = ActionChains(driver)
move_to_element(element) 鼠标悬停到指定元素 actions.move_to_element(driver.find_element(By.ID, "menu"))
context_click(element) 在元素上模拟鼠标右键操作(需指定元素) actions.context_click(driver.find_element(By.LINK_TEXT, "新闻"))
double_click(element) 双击指定元素 actions.double_click(driver.find_element(By.CLASS_NAME, "btn"))
drag_and_drop(source, target) 将源元素拖动到目标元素 actions.drag_and_drop(driver.find_element(By.ID, "item"), driver.find_element(By.ID, "trash"))
perform() 执行所有存储的鼠标操作(必须调用才会生效) actions.perform()

现在我们需要把百度--设置--搜索设置,将搜索历史记录从显示改成不显示:

这个代码,再'搜索设置'这里有问题

python 复制代码
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.edge.service import Service
from selenium.webdriver.edge.options import Options
import pandas as pd
import time

# 设置Edge浏览器选项
edge_options = Options()
edge_options.add_argument("--headless")  # 无头模式,不显示浏览器窗口
edge_options.add_argument("--disable-gpu")
edge_options.add_argument("--window-size=1920,1080")

# 指定Edge驱动路径(需要先下载对应版本的Edge驱动)
# 下载地址:https://developer.microsoft.com/en-us/microsoft-edge/tools/webdriver/
edge_service = Service('D:\桌面文件\edgedriver_win64\msedgedriver.exe')  # 替换为你的Edge驱动路径

# 启动Edge浏览器
driver = webdriver.Edge(service=edge_service, options=edge_options)
url = "https://www.baidu.com"
driver.get(url)
# 获取网页标题
print(driver.title)


# <a class="setpref first" href="javascript:;"><span class="set">搜索设置</span></a>,
# 如何通过elem1= driver.find_element(By.LINK_TEXT)找到搜索设置这个按键,然后elem1.click()点击

#2.定位到要悬停的元素
element= driver.find_element(By.XPATH, '//*[@id="s-usersetting-top"]')
print("定位到要悬停的元素")
#3.对定位到的元素执行鼠标悬停操作
ActionChains(driver).move_to_element(element).perform()
print("对定位到的元素执行鼠标悬停操作")
#4.等待悬停操作完成
time.sleep(2)

#找到链接,搜索设置并点击
#找到链接
elem1=driver.find_element_by_link_text("搜索设置")

print("找到链接")
elem1.click()
print("点击链接")

#通过元素选择器找到id=sh_2,并点击设置
elem2=driver.find_element(By.ID,"sh_2")
elem2.click()

#保存设置
elem3=driver.find_element(By.CLASS_NAME,"prefpanelgo")
elem3.click()

6.3.键盘操作

Selenium中的Key模块为我们提供了模拟键盘按键的方法,那就是send_keys()方法。它不仅可以模拟键盘输入,也可以模拟键盘的操作。

单键操作

模拟键盘按键 说明 补充信息
send_keys(Keys.BACK_SPACE) 删除键(BackSpace) 常用于删除输入框中的前一个字符
send_keys(Keys.SPACE) 空格键(Space) 输入空格或触发按钮焦点
send_keys(Keys.TAB) 制表键(Tab) 切换焦点到下一个元素
send_keys(Keys.ESCAPE) 回退键(Esc) 关闭弹窗或退出当前操作
send_keys(Keys.ENTER) 回车键(Enter) 确认输入或提交表单

组合键操作

模拟键盘按键 说明 典型应用场景
send_keys(Keys.CONTROL, 'a') 全选(Ctrl+A) 快速选中所有文本内容
send_keys(Keys.CONTROL, 'c') 复制(Ctrl+C) 复制选中文本到剪贴板
send_keys(Keys.CONTROL, 'x') 剪切(Ctrl+X) 剪切选中文本并保存到剪贴板
send_keys(Keys.CONTROL, 'v') 粘贴(Ctrl+V) 从剪贴板粘贴内容到当前位置
send_keys(Keys.F1)Keys.F12 功能键(F1-F12) 触发浏览器或应用的快捷键功能

6.4.获取断言信息

不管是在做功能测试还是自动化测试,最后一步需要拿实际结果与预期进行比较。这个比较的称之为断言。通过我们获取title 、URL和text等信息进行断言。

属性 说明
title 用于获得当前页面的标题
current_url 用户获得当前页面的URL
text 获取搜索条目的文本信息
python 复制代码
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.edge.service import Service
from selenium.webdriver.edge.options import Options
import pandas as pd
import time

# 设置Edge浏览器选项
edge_options = Options()
edge_options.add_argument("--headless")  # 无头模式,不显示浏览器窗口
edge_options.add_argument("--disable-gpu")
edge_options.add_argument("--window-size=1920,1080")

# 指定Edge驱动路径(需要先下载对应版本的Edge驱动)
# 下载地址:https://developer.microsoft.com/en-us/microsoft-edge/tools/webdriver/
edge_service = Service('D:\桌面文件\edgedriver_win64\msedgedriver.exe')  # 替换为你的Edge驱动路径

# 启动Edge浏览器
driver = webdriver.Edge(service=edge_service, options=edge_options)
url = "https://www.baidu.com"
driver.get(url)
# 获取网页标题
print(driver.title)

print("断言测试")
# 断言测试
driver.find_element_by_id("kw").send_keys("西南石油大学")
driver.find_element_by_id("su").click()
print(driver.current_url)
print(driver.find_element_by_class_name('nums').text)
python 复制代码
Before search================
百度一下,你就知道
https://www.baidu.com/
After search================
selenium_百度搜索
https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=0&rsv_idx=1&tn=baidu&wd=selenium&rsv_pq=a1d51b980000e36e&rsv_t=a715IZaMpLd1w92I4LNUi7gKuOdlAz5McsHe%2FSLQeBZD44OUIPnjY%2B7pODM&rqlang=cn&rsv_enter=0&rsv_sug3=8&inputT=758&rsv_sug4=759
搜索工具
百度为您找到相关结果约7,170,000个

6.5.多表单切换

在Web应用中经常会遇到frame/iframe表单嵌套页面的应用,WebDriver只能在一个页面上对元素识别与定位,对于frame/iframe表单内嵌页面上的元素无法直接定位。这时就需要通过switch_to.frame()方法将当前定位的主体切换为frame/iframe表单的内嵌页面中。

方法 说明
switch_to.frame() 将当前定位的主体切换为frame/iframe表单的内嵌页面中
switch_to.default_content() 跳回最外层的页面

163邮箱登录框的结构大概是这样子的,想要操作登录框必须要先切换到iframe表单。

python 复制代码
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.edge.service import Service
from selenium.webdriver.edge.options import Options
import pandas as pd
import time

# 设置Edge浏览器选项
edge_options = Options()
edge_options.add_argument("--headless")  # 无头模式,不显示浏览器窗口
edge_options.add_argument("--disable-gpu")
edge_options.add_argument("--window-size=1920,1080")

# 指定Edge驱动路径(需要先下载对应版本的Edge驱动)
# 下载地址:https://developer.microsoft.com/en-us/microsoft-edge/tools/webdriver/
edge_service = Service('D:\桌面文件\edgedriver_win64\msedgedriver.exe')  # 替换为你的Edge驱动路径

# 启动Edge浏览器
driver = webdriver.Edge(service=edge_service, options=edge_options)



driver.get("https://mail.163.com/")

driver.switch_to.frame(driver.find_element(By.CSS_SELECTOR,"iframe[id^='x-URS-iframe']"))
driver.find_element_by_name("email").clear()
driver.find_element_by_name("email").send_keys("***")
driver.find_element_by_name("password").clear()
driver.find_element_by_name("password").send_keys("***")
driver.find_element_by_id("dologin").click()
print("登录中...")
#检测是否登陆成功
driver.switch_to.default_content()


# # 等待登录成功
# wait = WebDriverWait(driver, 10, 0.5)
# wait.until(EC.presence_of_element_located((By.XPATH, '//*[@id="spnUid"]')))
driver.switch_to.default_content()
print(driver.title)
print(driver.current_url)
x=driver.page_source
print(driver.page_source)
#
# print("登录成功!")
# time.sleep(5)

# # <span id="spnUid" title="共有0封未读邮件">134****[email protected]</span>
# uid = driver.find_element_by_xpath('//*[@id="spnUid"]').get_attribute("title")
# print(uid)

driver.quit()

6.6.多窗口切换

在页面操作过程中有时候点击某个链接会弹出新的窗口,这时就需要主机切换到新打开的窗口上进行操作。WebDriver提供了switch_to.window()方法,可以实现在不同的窗口之间切换。

方法 说明
current_window_handle 获取当前焦点所在窗口的句柄(唯一标识符),返回字符串类型值。
window_handles 返回当前会话中所有已打开窗口的句柄列表(按打开时间排序),常用于多窗口遍历场景。
switch_to.window() 通过窗口句柄参数切换到目标窗口,需配合window_handles使用。与switch_to.frame() 的区别在于前者处理窗口级切换,后者处理页面内框架/表单切换。
python 复制代码
from selenium import webdriver
import time
driver = webdriver.Chrome("F:\Chrome\ChromeDriver\chromedriver")
driver.implicitly_wait(10)
driver.get("http://www.baidu.com")

#1.获得百度搜索窗口句柄
sreach_windows = driver.current_window_handle

driver.find_element_by_link_text('登录').click()
driver.find_element_by_link_text("立即注册").click()

#1.获得当前所有打开的窗口的句柄
all_handles = driver.window_handles

#3.进入注册窗口
for handle in all_handles:
    if handle != sreach_windows:
        driver.switch_to.window(handle)
        print('跳转到注册窗口')
        driver.find_element_by_name("account").send_keys('123456789')
        driver.find_element_by_name('password').send_keys('123456789')
        time.sleep(2)
    
driver.quit()

6.7.警告处理

在WebDriver中处理JavaScript所生成的alert、confirm以及prompt十分简单,具体做法是使用 switch_to.alert 方法定位到 alert/confirm/prompt,然后使用text/accept/dismiss/ send_keys等方法进行操作。

方法 说明
text 返回 alert/confirm/prompt 中的文字信息
accept() 接受现有警告框(相当于点击确认按钮)
dismiss() 解散现有警告框(相当于点击取消按钮)
send_keys(keysToSend) 发送文本至警告框(仅适用于 prompt 类型的输入框)
python 复制代码
from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains
import time

driver = webdriver.Chrome("F:\Chrome\ChromeDriver\chromedriver")
driver.implicitly_wait(10)
driver.get('http://www.baidu.com')

# 鼠标悬停至"设置"链接
link = driver.find_element_by_link_text('设置')
ActionChains(driver).move_to_element(link).perform()

# 打开搜索设置
driver.find_element_by_link_text("搜索设置").click()

#在此处设置等待2s否则可能报错
time.sleep(2)
# 保存设置
driver.find_element_by_class_name("prefpanelgo").click()
time.sleep(2)

# 接受警告框
driver.switch_to.alert.accept()

driver.quit()

6.8.下拉框

导入选择下拉框Select类,使用该类处理下拉框操作。

python 复制代码
from selenium.webdriver.support.select import Select

Select类的方法

方法 说明
select_by_value("选择值") select标签的value属性的值
select_by_index("索引值") 下拉框的索引
select_by_visible_testx("文本值") 下拉框的文本值
python 复制代码
from selenium import webdriver
from selenium.webdriver.support.select import Select
from time import sleep

driver = webdriver.Chrome("F:\Chrome\ChromeDriver\chromedriver")
driver.implicitly_wait(10)
driver.get('http://www.baidu.com')

#1.鼠标悬停至"设置"链接
driver.find_element_by_link_text('设置').click()
sleep(1)
#2.打开搜索设置
driver.find_element_by_link_text("搜索设置").click()
sleep(2)

#3.搜索结果显示条数
sel = driver.find_element_by_xpath("//select[@id='nr']")
Select(sel).select_by_value('50')  # 显示50条

sleep(3)
driver.quit()

6.9.文件上传

对于通过input标签实现的上传功能,可以将其看作是一个输入框,即通过send_keys()指定本地文件路径的方式实现文件上传。

通过send_keys()方法来实现文件上传:


python 复制代码
from selenium import webdriver
import os

driver = webdriver.Firefox()
file_path = 'file:///' + os.path.abspath('upfile.html')
driver.get(file_path)

# 定位上传按钮,添加本地文件
driver.find_element_by_name("file").send_keys('D:\\upload_file.txt')

driver.quit()

6.10.cookie操作

方法 说明 使用场景示例
get_cookies() 获取当前页面所有 Cookie 信息 检查页面 Cookie 配置
get_cookie(name) 获取指定名称的 Cookie 验证登录状态 Token
add_cookie(cookie_dict) 添加 Cookie 到当前会话 模拟已登录状态
delete_cookie(name) 删除指定 Cookie 清理测试环境
delete_all_cookies() 删除当前会话所有 Cookie 隐私测试初始化
python 复制代码
from selenium import webdriver
import time
browser = webdriver.Chrome("F:\Chrome\ChromeDriver\chromedriver")
browser.get("http://www.youdao.com")

#1.打印cookie信息
print('=====================================')
print("打印cookie信息为:")
print(browser.get_cookies)

#2.添加cookie信息
dict={'name':"name",'value':'Kaina'}
browser.add_cookie(dict)

print('=====================================')
print('添加cookie信息为:')
#3.遍历打印cookie信息
for cookie in browser.get_cookies():
    print('%s----%s\n' %(cookie['name'],cookie['value']))
    
#4.删除一个cookie
browser.delete_cookie('name')
print('=====================================')
print('删除一个cookie')
for cookie in browser.get_cookies():
    print('%s----%s\n' %(cookie['name'],cookie['value']))

print('=====================================')
print('删除所有cookie后:')
#5.删除所有cookie,无需传递参数
browser.delete_all_cookies()
for cookie in browser.get_cookies():
    print('%s----%s\n' %(cookie['name'],cookie['value']))

time.sleep(3)
browser.close()

6.11.窗口截图

方法 语法 适用场景 注意事项
页面截图 driver.save_screenshot(filename) 全页面截图 路径需包含扩展名(如 .png
元素截图 element.screenshot(filename) 特定元素截图 需确保元素可见
Base64编码截图 driver.get_screenshot_as_base64() 需要直接嵌入报告或前端 无需保存文件
二进制截图 driver.get_screenshot_as_png() 配合其他库处理图像
方法 说明
close() 关闭单个窗口
quit() 关闭所有窗口
相关推荐
SsummerC42 分钟前
【leetcode100】组合总和Ⅳ
数据结构·python·算法·leetcode·动态规划
Tandy12356_1 小时前
Godot开发2D冒险游戏——第一节:主角登场!
python·游戏引擎·godot
橘猫云计算机设计2 小时前
springboot基于hadoop的酷狗音乐爬虫大数据分析可视化系统(源码+lw+部署文档+讲解),源码可白嫖!
数据库·hadoop·spring boot·爬虫·python·数据分析·毕业设计
YOULANSHENGMENG2 小时前
linux 下python 调用c++的动态库的方法
c++·python
SsummerC3 小时前
【leetcode100】零钱兑换Ⅱ
数据结构·python·算法·leetcode·动态规划
一眼青苔3 小时前
切割PDF使用python,库PyPDF2
服务器·python·pdf
电商数据girl3 小时前
产品经理对于电商接口的梳理||电商接口文档梳理与接入
大数据·数据库·python·自动化·产品经理
三道杠卷胡4 小时前
【AI News | 20250424】每日AI进展
人工智能·pytorch·python·语言模型·github
T糖锅G4 小时前
小白自学python第二天
python