Selenium自动化测试工具

一 .Selenium简介

是一个用于Web应用程序测试的工具

Selenium的核心功能之一是测试软件在不同浏览器和操作系统上的兼容性,确保软件功能与用户需求的一致性,提升用户体验。

自动化脚本生成与执行

Selenium支持自动录制用户操作并生成多种编程语言的测试脚本,简化自动化流程,同时模拟用户行为执行JavaScript代码,处理动态加载内容。

解决反爬问题与验证码处理

Selenium能有效解决网页反爬策略,如模拟浏览器操作和执行JavaScript,对于难以通过请求库获取的数据,Selenium提供了更高效的解决方案,尽管需要注意资源消耗。

1.主要优势

(1)降低技术门槛

selenium的使用无需深入关注逆向参数,因为它模拟的是正常用户的操作,从而降低了自动化测试和数据抓取的技术门槛,使得非技术人员也能轻松上手。

(2)解决网页反爬问题

在爬虫领域,selenium通过模拟正常用户操作,能够有效绕过大部分网页的反爬机制,提高数据抓取的成功率和效率。

(3)自动化处理验证码

selenium在处理网站验证码方面具有优势,通过模拟正常用户行为,自动化处理验证码比逆向工程简单,提高了自动化流程的效率。

二. 安装与配置

1.安装Selenium

python 复制代码
pip install
selenium==3.141.0  -i https://pypi.tuna.tsinghua.edu.cn/simple

如果浏览器自动更新了

就会出现 驱动版本和浏览器版本不一致 更新一下驱动版本就好了

三. 基本使用方法

1.导包与实例化与浏览器控制

python 复制代码
import time

from selenium import webdriver

# 实例化驱动
browser = webdriver.Chrome()  # 单词C是大写的 后面的括号不能漏
browser.maximize_window()  # 最大化
# browser.minimize_window() # 最小化
browser.set_window_size(500, 1000)  # 自定义尺寸 宽500 高1000
browser.get("https://www.baidu.com/")  # get方法 操作浏览器 打开对应的url页面
#  一个标签页 访问这两个url
browser.get("https://www.douban.com/")

browser.back()  # 后退  百度

browser.forward()  # 前进 豆瓣
time.sleep(2)
browser.refresh()  # 刷新页面
time.sleep(2)
browser.save_screenshot("豆瓣.png")

browser.close()  # 关闭当前标签页 如果标签页只有一个 就会关闭浏览器
# browser.quit() #关闭浏览器

2.selenium的基本使用

python 复制代码
from selenium import webdriver
Chrome浏览器 实例化
browser= webdriver.Chrome()
browser.get('url') #访问页面
browser.maximize_window() # 窗口最大化
browser.minimize_window() # 最小化到任务栏
browser.set_window_size(600,700) # 自定义大小 浏览器宽600 高700
browser.save_screenshot('image.png') # 当前窗口截图
以png后缀结尾 源码写的!!!
browser.refresh() # 刷新页面
browser.back() # 后退 浏览器左上角的回退按钮
browser.forward() # 前进 浏览器左上角的前进按钮
browser.close() # 关闭当前标签页
browser.quit() # 关闭浏览器。

3.元素定位

(1)ID定位

ID定位是利用元素的唯一ID属性来寻找页面上的元素。这种方法快速且精确,前提是元素的ID在页面中是唯一的,适用于直接通过ID访问元素的场景。

(2)class和name定位

class和name定位分别通过元素的class属性和name属性进行定位。这两种方法在处理具有相同样式或名称的多个元素时非常有用,可以一次性定位到多个元素。

(3)CSS选择器和XPath定位

CSS选择器和XPath定位提供了更高级的选项,允许通过CSS规则或XPath路径表达式来定位元素。它们灵活强大,能够处理复杂的页面结构,但需要更多的技术知识。

python 复制代码
from selenium import webdriver
Chrome浏览器 实例化
browser= webdriver.Chrome()
browser.get('url') #访问页面
browser.find_element_by_id('id值') # ID定位
browser.find_element_by_class_name('class属性值') # class 定位
browser.find_element_by_name('name值') # name 定位
browser.find_element_by_css_selector('css选择器'). # css选择器定位
browser.find_element_by_xpath('xpath规则') # xpath定位
python 复制代码
'''
    需求
        想让selenium 操作浏览器 去访问百度搜索 某个关键字的文字
    真人操作
        1: 访问百度
        2:搜索框 输入关键字 点击百度一下按钮
    自动化selenium:
        自动化是模拟真人的步骤
        1:访问百度页面
        2: 元素定位 定位到指定元素(标签)  在这个需求中 是要定位到输入框
        3: 输入框 输入对应的关键字
        4: 定位到百度一下这个元素  进行点击操作
    find_element 查找元素的方法 返回第一个符合条件的元素
    find_elements 查找元素的方法 查找所有的符合条件的元素  返回的是列表

'''
from selenium import webdriver

# 实例化驱动
browser = webdriver.Chrome()  # 单词C是大写的 后面的括号不能漏

# 1:访问百度页面
browser.get("https://www.baidu.com/")

#  2: 元素定位 定位到指定元素(标签)
# 3: 输入框 输入对应的关键字  send_keys 指定位置 输入内容
browser.find_element_by_id("kw").send_keys("南风")  # 传id的值
browser.find_element_by_class_name("s_ipt").send_keys("南风2")  # 传class属性值
browser.find_element_by_name("wd").send_keys("南风3")  # 传name属性的值
browser.find_element_by_xpath('//input[@id="kw"]')  # 传xpath规则
browser.find_element_by_css_selector('#kw')  # 传选择器值

# 4: 定位到百度一下这个元素  进行点击操作
import time
browser.find_element_by_id("su").click() # click点击的方法
time.sleep(4)
# page_source返回响应的内容
print(browser.page_source)

4.selenium的其他方法

python 复制代码
from selenium import webdriver
Chrome浏览器 实例化
browser= webdriver.Chrome()
browser.get('url') #访问页面
browser.title # 当前标签页标题
browser.current_url # 当前url
size 返回元素大小
text 获取元素的文本
get_attribute("xxx") 获取属性值;xxx:要获取的属性
is_displayed() 判断元素是否可见
is_enabled() 判断元素是否可用
注意
size、text、title、current_url:为属性,调用时无括号;如:xxx.size
title、current_url:使用浏览器实例化对象直接调用; 如:
browser.title
python 复制代码
from selenium import webdriver

# 实例化驱动
browser = webdriver.Chrome()  # 单词C是大写的 后面的括号不能漏

# 1:访问百度页面
browser.get("https://www.baidu.com/")
print(browser.title) # 当前标签页标题
print(browser.current_url) # 当前url
# find_element_by_id
print(browser.find_element_by_id('kw')) # 搜索框的元素
print(browser.find_element_by_id('kw').size) # 返回元素大小
content_element = browser.find_element_by_xpath('//span[@class="title-content-title"]')

print(content_element.text)# 获取元素的文本
print(content_element.get_attribute('class'))
print(content_element.is_displayed()) # 判断元素是否可见
print(content_element.is_enabled()) # 判断元素是否可用
'''
    browser.title # 当前标签页标题
    browser.current_url # 当前url
    size 返回元素大小
    text 获取元素的文本
    get_attribute("xxx") 获取属性值;xxx:要获取的属性
    is_displayed() 判断元素是否可见
    is_enabled() 判断元素是否可用
'''
相关推荐
龙哥说跨境11 分钟前
如何使用AdsPower指纹浏览器克服爬虫技术限制,安全高效进行爬虫!
爬虫·安全
朝九晚五ฺ19 分钟前
【Linux探索学习】第九弹——Linux工具篇(四):项目自动化构建工具—make/Makefile
linux·运维·学习·ubuntu·自动化
测试老哥7 小时前
Python+Selenium+Pytest+POM自动化测试框架封装(完整版)
自动化测试·软件测试·python·selenium·测试工具·职场和发展·测试用例
独行soc9 小时前
#渗透测试#红蓝对抗#Src漏洞挖掘 介绍-Yakit(3)
测试工具·web安全·网络安全·yakit·护网
互联网杂货铺9 小时前
Python测试框架—pytest详解
自动化测试·软件测试·python·测试工具·测试用例·pytest·1024程序员节
T_Y994310 小时前
selenium学习日记
学习·selenium·测试工具
搬砖天才、10 小时前
自动化部署-02-jenkins部署微服务
微服务·自动化·jenkins
思通数据11 小时前
AI助力医疗数据自动化:诊断报告识别与管理
大数据·人工智能·目标检测·机器学习·计算机视觉·目标跟踪·自动化
CYRUS STUDIO11 小时前
frida脚本,自动化寻址JNI方法
android·运维·自动化·逆向·移动安全·jni·frida
幽兰的天空13 小时前
简单的Python爬虫实例
开发语言·爬虫·python