selenium学习笔记

什么是selenium

比较官方的解释

Selenium是一个自动化测试工具,用于在Web应用程序中模拟用户操作。它提供了一组API,可以通过编程方式控制浏览器,并模拟用户的交互行为,例如点击、输入文本和导航等。Selenium支持多种编程语言,包括Java、C#、Python、Ruby、JavaScript等,并可以在多个浏览器和操作系统上运行测试。Selenium的目标是帮助测试人员自动化测试过程,提高测试效率和测试质量。

个人的简单理解

  1. 浏览器驱动可以操作浏览器,不用selenium也能实现代码控制浏览器的效果,就是需要自己查询浏览器启动提供的功能,
  2. selenium可以看成是浏览器驱动的工具类,在项目中引入seleniu,就能通过selenium方便的操作浏览器

用途

  1. 自动化测试
  2. 爬虫,这里主要做爬虫使用

各种爬虫的比较

  1. 直接通过http工具调用接口

    例如HttpClient、OkHttp、RestTemplate等,此种方法需要注意数据的完整性,页面上一个操作可能会涉及到多个接口的调用,如果调用不全可能会造成一些异常数据,另外如果请求中有一些自定义的加密请求头,就需要扒前端源码,找到加密算法,前端源码往往是经过编译后的,可读性比较差,想到加密算法比较费劲

Java环境搭建

下载对应的浏览器和驱动

浏览器版本和浏览器驱动版本要保持一致(一般前三位一致即可),浏览器和对应的驱动见附件

引入依赖

xml 复制代码
<dependency>
    <groupId>org.seleniumhq.selenium</groupId>
    <artifactId>selenium-java</artifactId>
    <version>3.141.59</version>
</dependency>

此种方法不是最佳实践,最佳实践是连接已经打开的浏览器,退出时仅仅退出浏览器驱动,不退出已经打开的浏览器,见最佳实践部分

java 复制代码
public class HelloSelenium {
    @SneakyThrows
    public static void main(String[] args) {
        // 设置 ChromeDriver 的路径
        System.setProperty("webdriver.chrome.driver", "C:\\118.0.5993.70\\chromedriver-win64\\chromedriver.exe");

        // 配置 ChromeOptions
        ChromeOptions options = new ChromeOptions();
        // 指定特定版本的 Chrome 浏览器路径 浏览器版本和浏览器驱动版本要保持一致(一般前三位一致即可)
        options.setBinary("C:\\118.0.5993.70\\chrome-win64\\chrome.exe");
        // 可选:无头模式,不打开浏览器窗口 如果做爬虫不打开浏览器某些网站过不去,可能会遇到Enable JavaScript and cookies to continue
        // options.addArguments("--headless");
        // 解决一些系统的图形化渲染问题
        options.addArguments("--disable-gpu");
        // 在某些系统上需要添加此参数
        options.addArguments("--no-sandbox");
        // 解决资源共享内存的问题
        options.addArguments("--disable-dev-shm-usage");

        // 创建 ChromeDriver 实例
        WebDriver driver = new ChromeDriver(options);
        // 为浏览器驱动driver创建一个等待器,循环等待,直到条件达成或者超时,如果条件未达成超时就会跑出异常
        WebDriverWait wait = new WebDriverWait(driver, 10);
        try {
            // 访问指定的 URL
            driver.get("http://localhost:8080");
            // 直接使用driver.findElement可能元素还没有加载出来读取不到,wait.until会一直检测,直到找到元素或者超时
            // WebElement nameInput = driver.findElement(By.xpath("/html/body/div[1]/form/div[1]/div/div/input"));
            WebElement nameInput = wait.until(ExpectedConditions.presenceOfElementLocated(By.xpath("/html/body/div[1]/form/div[1]/div/div/input")));
            nameInput.sendKeys("张无忌");
            List<WebElement> buttons = driver.findElements(By.tagName("button"));
            WebElement queryButton = buttons.stream().filter(item -> "查询".equals(item.getText())).findFirst().get();
            queryButton.click();
        } catch (Exception e) {
            e.printStackTrace();
        } finally {
            // 方便观察浏览器,避免马上退出
            Thread.sleep(10 * 1000);
            // 退出浏览器驱动程序,关闭所有关联的窗口。(如果不退出浏览器驱动器不会结束,多次运行会启动多个浏览器驱动,占用系统资源)
            driver.quit();
        }
    }

options全部参数可参考https://peter.sh/experiments/chromium-command-line-switches/

常用方法

java 复制代码
// 请求一个页面,不支持前进和后退切换
driver.get(url); 
// 和get类似,支持前进和后退切换
driver.navigate().to(url); 
// 退到上一个页面 ,前提必须前进了一个页面才能回退
driver.navigate().back(); 
// 指前进到下一个页面 ,前提是必须后退后才能前进
driver.navigate().forward(); 
// 刷新当前页面
driver.navigate().refresh(); 
// 通用搜索,第一个 , By里包含常用的各种搜索
WebElement findElement(By by); 
// 通用搜索,多个,By里包含常用的各种搜索
List<WebElement> findElements(By by); 
// 关闭当前窗口,如果它是当前打开的最后一个窗口,则退出浏览器。
driver.close();
// 退出此驱动程序,关闭每个相关窗口。
driver.quit(); 

WebElement常用方法

元素定位

根据id属性匹配

java 复制代码
public static By id(String id) {
  return new ById(id);
}

根据a标签内容匹配

java 复制代码
public static By linkText(String linkText) {
  return new ByLinkText(linkText);
}

根据a标签内容模糊匹配

java 复制代码
public static By partialLinkText(String partialLinkText) {
  return new ByPartialLinkText(partialLinkText);
}

根据name属性匹配

java 复制代码
public static By name(String name) {
  return new ByName(name);
}

根据标签名字匹配

java 复制代码
public static By tagName(String tagName) {
  return new ByTagName(tagName);
}

根据路径匹配

路径可直接在浏览器中拷贝

java 复制代码
public static By xpath(String xpathExpression) {
  return new ByXPath(xpathExpression);
}

根据类名匹配

java 复制代码
public static By className(String className) {
  return new ByClassName(className);
}

根据css选择器匹配

java 复制代码
public static By cssSelector(String cssSelector) {
  return new ByCssSelector(cssSelector);
}

元素操作

  1. click():点击该元素。
  2. submit():将表单提交到该元素所在的表单。
  3. sendKeys(CharSequence... keysToSend):将指定的字符序列发送到该元素。例如向输入框输入文本。
  4. clear():清除该元素的内容。
  5. getTagName():获取该元素的标签名称。
  6. getAttribute(String name):获取该元素指定属性的值。
  7. getText():获取该元素的文本内容。
  8. isEnabled():判断该元素是否可用。
  9. isSelected():判断该元素是否被选中。
  10. isDisplayed():判断该元素是否可见。
  11. getLocation():获取该元素在页面中的位置。以Point对象表示,包含xy坐标。
  12. getSize():获取该元素的大小,以Dimension对象表示,包含widthheight
  13. getCssValue(String propertyName):获取该元素指定CSS属性的值。

等待机制

显式等待

  • 使用 WebDriverWaitExpectedConditions 来等待特定条件(如元素可点击、元素存在等)。
java 复制代码
// 配置 ChromeOptions
ChromeOptions options = new ChromeOptions();
// 指定特定版本的 Chrome 浏览器路径 浏览器版本和浏览器驱动版本要保持一致(一般前三位一致即可)
options.setBinary("C:\\118.0.5993.70\\chrome-win64\\chrome.exe");
WebDriver driver = new ChromeDriver(options);
// 创建一个显示等待器,超时时间10S
WebDriverWait wait = new WebDriverWait(driver, 10)
// 循环寻找一个h3元素,10s内找到返回该元素,10s找不到抛出异常
WebElement h3 = wait.until(ExpectedConditions.presenceOfElementLocated(By.tagName("h3")));  

隐式等待

隐式等待在Java中通过WebDrivermanage().timeouts().implicitlyWait方法实现。以下是一个示例代码:

java 复制代码
import org.openqa.selenium.By;
import org.openqa.selenium.WebDriver;
import org.openqa.selenium.WebElement;
import org.openqa.selenium.chrome.ChromeDriver;
import java.util.concurrent.TimeUnit;

public class ImplicitWaitExample {
    public static void main(String[] args) {
        // 设置ChromeDriver的路径
        System.setProperty("webdriver.chrome.driver", "path/to/chromedriver");
        // 初始化WebDriver
        WebDriver driver = new ChromeDriver();
        // 设置隐式等待时间为10秒
        driver.manage().timeouts().implicitlyWait(10, TimeUnit.SECONDS);
        // 打开一个网页
        driver.get("http://example.com");
        try {
            // 查找元素 如果10s内找到则返回元素,如果10秒没有找到则抛出异常
            WebElement element = driver.findElement(By.id("myElement"));
            // 操作元素
            element.click();
        } catch (Exception e) {
            e.printStackTrace();
        } finally {
            // 关闭浏览器
            driver.quit();
        }
    }
}

在这个示例中,implicitlyWait方法设置了一个最长等待时间为10秒,在查找元素时,如果元素未立即出现,WebDriver会等待这个时间内不断尝试查找元素。

显示等待与隐式等待的区别

  1. 显示等待是指在代码中明确指定等待条件和等待时间,直到条件成立或等待时间到期,程序才会继续执行下一步操作。显示等待可以根据不同的条件进行等待,例如元素的可见性、可点击性、文本内容、属性值等。显示等待可以通过ExpectedConditions类来实现。

2 隐式等待是指在代码中设置一个全局等待时间,在此时间内如果元素没有立即出现,程序将等待指定的时间,等待元素出现。隐式等待适用于整个测试用例,而不是针对某个特定的元素。隐式等待可以通过WebDriver.Timeouts.implicitlyWait()方法来设置。。

最佳实践

打开与关闭浏览器驱动

开启浏览器debug端口

连接到已经打开的浏览器,需要浏览器开启debug端口,简单的开启方法

  1. 为chrome.exe创建一个快捷方式

  2. chrome.exe创建>>右键>>属性>>目标后面添加--remote-debugging-port=9222(注意chrome.exe与新加内容之间有个空格,端口可以自由定义)

  3. 直接打开浏览器即可

  4. 检查浏览器是否开启了debug端口,访问http://localhost:9222/json,返回一下内容说明浏览器成功开启了debug端口,9222是自定义端口

json 复制代码
[ {
   "description": "",
   "devtoolsFrontendUrl": "/devtools/inspector.html?ws=localhost:9222/devtools/page/B3C592C54EB3552A0F5D76706A6EF844",
   "id": "B3C592C54EB3552A0F5D76706A6EF844",
   "title": "emp",
   "type": "page",
   "url": "http://localhost:8080/",
   "webSocketDebuggerUrl": "ws://localhost:9222/devtools/page/B3C592C54EB3552A0F5D76706A6EF844"
} ]

创建浏览器驱动并连接到已经打开的浏览器

java 复制代码
public void openChrome() {
    // 设置 ChromeDriver 的路径
    System.setProperty("webdriver.chrome.driver", "C:\\118.0.5993.70\\chromedriver-win64\\chromedriver.exe");

    // 配置 ChromeOptions
    ChromeOptions options = new ChromeOptions();
    options.setExperimentalOption("debuggerAddress", "localhost:9222");

    // 创建 ChromeDriver 实例
    driver = new ChromeDriver(options);

}

退出浏览器驱动ChromeDriver

java 复制代码
public void closeChrome() {
    // 退出浏览器驱动程序
    driver.quit();
}

不要让ChromeDriver打开浏览器,让ChromeDriver链接到已经打开的浏览器,好处如下

  1. 退出浏览器驱动时不退出浏览器,如果用浏览器驱动打开浏览器,调用driver.quit()方法退出浏览器驱动时会关闭浏览器(有时候我们想看到最好操作的结果,不希望退出浏览器)
  2. ChromeDriver打开的浏览器中不一定有身份信息,可能需要登录.自己可以提前打开好浏览器,并且登录相关网站

元素定位

  1. 如果页面元素相对比较固定,可以直接用xpath定位,简单直接,xpath可以直接从浏览器赋值

复制出来的xpath直接粘贴到代码里即可

/html/body/div[2]/div[1]/div/div[1]/div/div/div[1]/div/form/div[2]/div/div[1]/div[1]/textarea

如果前端页面频繁更新,页面元素位置经常变动,就不太适合这种方式了

  1. 如果页面元素经常变动,但是提示语或者某些属性比较固定,可以拿到所有这个类型的元素,再根据固定的属性过滤
java 复制代码
List<WebElement> textareaList = driver.findElements(By.tagName("textarea"));
for (WebElement textarea : textareaList) {
    String placeholder = textarea.getAttribute("placeholder");
    if (placeholder.contains("内容概要+适用人群+使用场景及目标+其他说明")) {
        // 拿到了资源描述文本框
    }
}

selenium实战

基于selenium的crud

  1. 启动项目
  2. crud详见代码com.study.selenium.EmpCRUDTest
  3. 效果见演示视频
相关推荐
bohu837 小时前
OpenCV笔记3-图像修复
笔记·opencv·图像修复·亮度增强·图片磨皮
大丈夫立于天地间8 小时前
ISIS基础知识
网络·网络协议·学习·智能路由器·信息与通信
doubt。8 小时前
【BUUCTF】[RCTF2015]EasySQL1
网络·数据库·笔记·mysql·安全·web安全
Chambor_mak9 小时前
stm32单片机个人学习笔记14(USART串口数据包)
stm32·单片机·学习
Zelotz9 小时前
线段树与矩阵
笔记
汇能感知9 小时前
光谱相机在智能冰箱的应用原理与优势
经验分享·笔记·科技
PaLu-LI9 小时前
ORB-SLAM2源码学习:Initializer.cc⑧: Initializer::CheckRT检验三角化结果
c++·人工智能·opencv·学习·ubuntu·计算机视觉
yuanbenshidiaos10 小时前
【大数据】机器学习----------计算机学习理论
大数据·学习·机器学习
汤姆和佩琦10 小时前
2025-1-20-sklearn学习(42) 使用scikit-learn计算 钿车罗帕,相逢处,自有暗尘随马。
人工智能·python·学习·机器学习·scikit-learn·sklearn
Tech智汇站10 小时前
Quick Startup,快捷处理自启程序的工具,加快电脑开机速度!
经验分享·科技·学习·学习方法·改行学it