Java/Kotlin 使用 Chrome 无头浏览器

1. 概念

无头浏览器在类似于流行网络浏览器的环境中提供对网页的自动控制，但是通过命令行界面或使用网络通信来执行。它们对于测试网页特别有用，因为它们能够像浏览器一样呈现和理解超文本标记语言，包括页面布局、颜色、字体选择以及JavaScript和AJAX的执行等样式元素，这些元素在使用其他测试方法时通常是不可用的。[1][2]

无头浏览器通常用来：

Web应用程序中的测试自动化。
拍摄网页截图
对JavaScript库运行自动化测试
收集网站数据
自动化网页交互

1.2 与传统的Http 库做爬虫对比

无头浏览器与HTTP库都可以用于爬虫，但它们有一些区别和优劣势。无头浏览器指的是使用脚本来模拟真实浏览器的使用场景，它能够更好地处理JavaScript渲染、异步请求等问题，而HTTP库则更适合处理静态页面、API等。

无头浏览器:

JavaScript渲染和动态页面处理: 如果你需要爬取动态页面或者需要执行JavaScript代码，无头浏览器是更好的选择。
JavaScript解密：无头浏览器不能解密js脚本以此让你查阅，但是他能执行该脚本以此来得到结果。而HTTP库对于加密的JS需要进行JS逆向等操作之后在模拟加密过程才能与API进行访问，而无头浏览器直接帮你进行模拟。无头模拟器通常用于有加密的js的网站
隐私和安全：无头浏览器可以模拟真实的用户行为 ，更能够避免被网站检测到并阻止。此外，无头浏览器可以自主的使用代理、设置cookies等方式来保护隐私和安全。因此可以做到处理反爬虫的效果

HTTP库：

性能和速度：HTTP库通常比无头浏览器更快。HTTP只需要考虑API和静态页面的获取，不需要解析页面，获取CSS，渲染页面
代码复杂度和维护成本：获取某个数据可以通过少量代码直接调用API。使用无头浏览器可能需要更复杂的代码，因为需要编写JavaScript代码来模拟用户行为和操作DOM

1.3 无头浏览器一览

Headless Chrome： Google推出的无头浏览器，可以模拟Chrome浏览器的所有功能，包括JavaScript解析、HTML解析、CSS解析等。
Selenium ： 并不是一个无头浏览器，而是一个浏览器自动化测试工具，这个通常会被搞混，他可以通过驱动程序来自动化操作对应的浏览器。Selenium可以支持多款主流浏览器，包括Chrome、Firefox、Safari等。同时 Selenium还支持浏览器的无头模式，比如Firefox、PhantomJS、Chrome的无头模式（Headless）等
Puppeteer： Google开发的一个Node.js库，用于控制Headless Chrome，可以模拟用户操作、截屏、生成PDF等。
Playwright： Microsoft开发的一个Node.js库，可以控制多个浏览器，包括Chrome、Firefox和Safari等，可以模拟用户操作、截屏、生成PDF等。
Splash：一个基于Python的无头浏览器，可以解析JavaScript、渲染网页、截屏等，可以通过HTTP API进行控制。
HtmlUnit: 一款基于Java的开源无头浏览器，它可以模拟浏览器行为并执行JavaScript代码。它可以与JUnit和TestNG等测试框架集成，用于自动化测试和Web爬虫等任务。
JBrowserDriver: 一款基于Selenium WebDriver的无头浏览器，它使用Java Swing库模拟浏览器界面。它可以模拟用户行为，进行自动化测试和Web爬虫等任务。然而，由于它使用了Java Swing库，因此可能需要更多的资源。
Cobra: 一款Java HTML解析器和渲染引擎，可以模拟浏览器行为并执行JavaScript代码。它可以用于自动化测试、Web爬虫和Web应用程序等任务。然而，由于它不是专门为自动化测试而设计的，因此可能需要更多的配置和代码。

1.4. 自动化配置环境

2.1 引入依赖：

ChromiumDownloader 是用于下载 Chromium 和对应的 ChromiumDriver。

同时ChromiumDownloader依赖了 selenium 所以仅需要引入这个一个依赖即可，如果需要更换 selenium 另外自行引入即可

xml 复制代码

<dependency>
    <groupId>io.github.zimoyin</groupId>
    <artifactId>ChromiumDownloader</artifactId>
    <version>1.2.0</version>
</dependency>

2.2 下载 Chromium/ChromiumDriver

使用 ChromiumLoader.downloadAndLoad 即可自动下载 Chromium/ChromiumDriver 如果在本地./chrome查找到了 Chromium/ChromiumDriver 则不会去下载了

kotlin 复制代码

val proxy = Proxy(Proxy.Type.HTTP, InetSocketAddress("127.0.0.1", 8070))
val options = ChromiumLoader.downloadAndLoad(proxy)

因为需要到谷歌服务器去下载文件，所以对于需要一些特殊的Proxy才能访问和下载。

如果需要手动下载到该构建网站下载最新的构建版本即可: 点击跳转

2.3 访问百度

至此一个最简单的功能已将实现了，通过 ChromiumDownloader 不再需要手动去下载Chrome 和它的驱动了

kotlin 复制代码

val options = ChromiumLoader.downloadAndLoad(proxy)
// 注意 Root 运行需要关闭沙盒
options.addArguments("--no-sandbox")
options.addArguments("--disable-dev-shm-usage")
options.addArguments("--ignore-ssl-errors=yes")
options.addArguments("--ignore-certificate-errors")
options.addArguments("--headless")
ChromeDriver(options).use {
    get("https://www.baidu.com")
}

小工具

获取浏览器和驱动的版本号

kotlin 复制代码

println(ChromiumLoader.getChromeDriverVersion(path))
println(ChromiumLoader.getChromeVersion(path))

2.Headless Chrome

2.1 环境搭建

2.1.1 安装Chrome

Windows : 直接在 Chrome/Chromium 官网下载。推荐使用 Chromium 开箱即用。

历史版本:

Chromium历史版本第三方版本统计: 基本包括驱动版本
官方历史快照版: 基本包括驱动版本
1. 选择您的平台：Mac、Win、Linux、ChromiumOS
2. 选择您想要使用的 Chromium 内部版本号
  1. LAST_CHANGE文件中提到了最新的
3. 下载包含 Chromium 的 zip 文件
4. 里面有一个二进制可执行文件可以运行

如何指定打开的浏览器，而不是默认的浏览器 :

通过将驱动放在你浏览器所在的文件夹内，并设置 System.setProperty("webdriver.chrome.driver","驱动地址"); 即可
通过代码进行设置

java 复制代码

System.setProperty("webdriver.chrome.driver","bin path:驱动地址")
ChromeOptions options = new ChromeOptions();
options.setBinary("bin path: 浏览器的执行文件");
ebDriver driver = new ChromeDriver(options);

linux：请百度，我使用的是Ubuntu 所以我直接百度的 Ubuntu Ser ver 安装 Chrome

Linux : 安装chrome headless CHATGPT

Chrome Headless实际上是Chrome浏览器的无界面版本，可以通过命令行进行操作。以下是在Linux系统中安装Chrome Headless的步骤：

确认系统已安装Google Chrome浏览器，如果没有，可以使用以下命令安装：
复制代码
```
sqlCopy codesudo apt update
sudo apt install google-chrome-stable
```

安装Chromium浏览器所需的依赖项：

复制代码

sqlCopy codesudo apt update
sudo apt install -y unzip libgconf-2-4 libnss3-dev libfontconfig1

下载ChromeDriver：

复制代码

bashCopy codewget https://chromedriver.storage.googleapis.com/91.0.4472.101/chromedriver_linux64.zip
unzip chromedriver_linux64.zip
sudo mv chromedriver /usr/local/bin/
sudo chown root:root /usr/local/bin/chromedriver
sudo chmod +x /usr/local/bin/chromedriver

启动Chrome浏览器，并设置Headless模式：

复制代码

cssCopy code
google-chrome-stable --headless --disable-gpu --no-sandbox --remote-debugging-port=9222

现在您可以使用Chrome浏览器和Headless模式进行操作。例如，您可以使用Selenium WebDriver进行自动化测试或网络爬虫。

注意：请注意安全问题。在生产环境中使用Chrome Headless时，请确保采取适当的安全措施，如限制访问Chrome浏览器的端口或禁用某些Chrome浏览器的功能。

2.1.2 启动浏览器

打开 Chromestatus 网站

复制代码

# chrome 是二进制文件不是命令，你可以打开Chrome的安装目录找到
# 或者新建一个 Chrome 快捷方式，在快捷方式的属性里找到 快捷方式-目标 添加以下参数
# --user-data-dir=D:\Chrome\user1 这是设置缓存目录的参数
chrome --headless --disable-gpu --remote-debugging-port=9222 https://www.chromestatus.com

2.1.3 下载chromedriver

找到对应浏览器版本的驱动

官方网站：http://chromedriver.storage.googleapis.com/index.html

2.1.4 配置 chromedriver 的环境变量

在环境变量里面的 Path 添加 chromedriver 所在文件夹的路径。注意可以不设置

2.1.5 添加依赖

注意第一个的版本必须是最新的否则可能与驱动不匹配。第二个依赖可以不引入，如果发生了异常再引入也可以

xml 复制代码

<dependency>
    <groupId>org.seleniumhq.selenium</groupId>
    <artifactId>selenium-java</artifactId>
    <!--<version>3.4.0</version>-->
    <version>4.7.2</version>
</dependency>


<!-- https://mvnrepository.com/artifact/com.google.guava/guava -->
<dependency>
    <groupId>com.google.guava</groupId>
    <artifactId>guava</artifactId>
    <version>24.1-jre</version>
</dependency>

2.1.6 代码启动浏览器

https://blog.csdn.net/qq_22003641/article/details/79137327

https://blog.csdn.net/dengjie811227/article/details/102292146

https://www.cnblogs.com/eastonliu/p/9102239.html

https://blog.csdn.net/erhuobuer/article/details/108680617

java 复制代码

//驱动地址: 如果不设置环境变量则需要设置驱动地址
//如果想要打开特点的浏览器，就把驱动放在那个浏览器的所在文件夹内，比如要打开Chromium 就放在 Chromium 的文件夹内
System.setProperty("webdriver.chrome.driver","/chromedriver");
// 设置驱动
ChromeOptions options=new ChromeOptions();
//设置 chrome 的无头模式
options.addArguments("--headless");
options.addArguments("--disable-gpu");
options.addArguments("--no-sandbox");
options.addArguments("--disable-dev-shm-usage");
options.addArguments("--start-maximized");
//因为报表页面必须滚动才能全部展示，这里直接给个很大的高度
options.addArguments("--window-size=1280,4300");
//设置用户目录
options.addArguments(" --user-data-dir=D:\\Chrome\\user1");
// 创建webdriver驱动
WebDriver driver = new ChromeDriver(options);

//注意 UA为 User-Agent: selenium/4.8.3 (java windows)
// 访问网页
webDriver.get(url);
// Selenium提供了8种定位方式。请通过 By这个类查看
//clear() 清除文本。sendKeys(*value) 模拟按键输入。click() 单击元素。submit()方法用于提交表单
// 获取输入框，输入selenium
driver.findElement(By.id("kw")).sendKeys("selenium");
// 获取"百度一下"按钮，进行搜索
driver.findElement(By.id("su")).click();


//模拟键盘
//WebElement 对象.sendKeys(Keys.SPACE)//注意可以用组合键

//执行javascript 可以直接设置localstroage,cookie等方式。不过拼字符串实在太麻烦
String token = "localStorage.setItem('cloud.token','{\"val\":\"5d31f455-8ed5-4ebe-80d1-760665df452c\",\"expires\":1584531900299}')";
((JavascriptExecutor)webDriver).executeScript(token);

//定位section元素
WebElement element =  webDriver.findElement(By.tagName("section"));
Point p = element.getLocation();
int width = element.getSize().getWidth();
int height = element.getSize().getHeight();
Rectangle rec = new Rectangle(p.getX(),p.getY(),height,width);

//截取全屏
File scrFile  = ((TakesScreenshot)webDriver).getScreenshotAs(OutputType.FILE);
//在全屏图片下裁剪
BufferedImage img = ImageIO.read(scrFile);
BufferedImage dest = img.getSubimage(p.getX(), p.getY(),rec.getWidth(),rec.getHeight());
ImageIO.write(dest, "png", scrFile);
//拷贝文件
FileUtils.copyFile(scrFile , new File("a.png"));
log.info("截图完成");
//退出
webDriver.quit();

java 复制代码

WebDriver driver = new ChromeDriver();    //Chrome浏览器
WebDriver driver = new FirefoxDriver();   //Firefox浏览器
WebDriver driver = new EdgeDriver();      //Edge浏览器
WebDriver driver = new InternetExplorerDriver();  // Internet Explorer浏览器
WebDriver driver = new OperaDriver();     //Opera浏览器
WebDriver driver = new PhantomJSDriver();   //PhantomJS

2.2 报错

如果报错请首要排查三个原因

chrome 版本是否与驱动大版本一致，建议都升级为最新版
java 引入的jar库是否是最新版
Exception in thread "main" org.openqa.selenium.SessionNotCreatedException: Could not start a new session. Response code 500. Message: unknown error: failed to write first run file

这个异常通常是由于Selenium驱动程序无法启动浏览器会话导致的，可能是由于驱动程序版本与浏览器版本不兼容，或者是由于缺少浏览器二进制文件或用户权限不足等原因。如果你设置了用户缓存目录请给予java程序权限

org.openqa.selenium.UnhandledAlertException: unexpected alert open: {Alert text : Hello World!}

这个异常通常是由于在执行测试期间，页面上出现了未预期的弹窗，例如警告框、确认框或提示框等。

要解决这个问题，您可以尝试以下几个步骤：

使用switchTo().alert()方法切换到警告弹窗并处理它。例如，您可以使用accept()方法点击弹窗上的"确定"按钮，或使用dismiss()方法点击弹窗上的"取消"按钮。

在执行任何可能引发警告弹窗的操作之前，可以使用driver.switchTo().alert()方法来检查页面是否有警告弹窗。如果存在，可以通过上述方法来处理它。

NoSuchElementException：当尝试访问不存在的元素时，会引发此异常。
TimeoutException：当 Selenium 超时并无法在指定时间内找到所需的元素或页面元素时，会引发此异常。
StaleElementReferenceException：当尝试访问一个已经被删除或不再可用的元素时，会引发此异常。
ElementNotVisibleException：当尝试访问一个隐藏的元素时，会引发此异常。
ElementNotInteractableException：当尝试与无法与之交互的元素进行交互时，会引发此异常。
InvalidSelectorException：当选择器无效或不符合语法规则时，会引发此异常
NoSuchWindowException：当尝试访问不存在的窗口时，会引发此异常。
UnhandledAlertException：当出现未处理的警告弹窗时，会引发此异常。
SessionNotCreatedException：当浏览器会话无法启动时，会引发此异常。
WebDriverException：这是一个通用异常，可能由各种原因引起，例如网络连接问题、代理设置错误等。
SessionNotCreatedException：当浏览器会话无法创建或启动时，会引发此异常。可能是因为缺少驱动程序或浏览器版本不兼容等原因。
TimeoutException：当 Selenium 无法在指定的时间内执行操作时，会引发此异常。例如，当页面加载过慢或元素不可见时。
NoSuchWindowException：当尝试访问不存在的浏览器窗口时，会引发此异常。
NoSuchSessionException：当尝试访问已经关闭的浏览器会话时，会引发此异常。
ElementNotVisibleException：当尝试访问不可见的元素时，会引发此异常。
ElementNotSelectableException：当尝试选择不支持选择操作的元素时，会引发此异常。
InvalidSelectorException：当选择器无效或不符合语法规则时，会引发此异常。
JavascriptException：当在 JavaScript 代码中发生错误时，会引发此异常。
UnhandledAlertException：当出现未处理的警告弹窗时，会引发此异常。

2.3 项目实例

2.3.0 设置WebDriver

DesiredCapabilities 和 ChromeOptions 都是用于设置 WebDriver 的选项和配置的类。它们之间的区别在于：

DesiredCapabilities 是 Selenium WebDriver 中的一个通用选项类，可以用于设置所有支持的浏览器的选项。而 ChromeOptions 是针对 Chrome 浏览器的选项类，只能用于设置 Chrome 浏览器的选项。
DesiredCapabilities 可以设置的选项包括浏览器类型、版本、操作系统、页面加载策略、代理等。而 ChromeOptions 可以设置的选项包括二进制文件路径、启动参数、扩展、调试端口等。
在使用 Chrome 浏览器时，您通常需要使用 ChromeOptions 来设置选项，例如指定浏览器的二进制文件路径或设置启动参数。而在使用其他浏览器时，您可能需要使用 DesiredCapabilities 来设置选项。

java 复制代码

// 创建一个 ChromeOptions 对象
ChromeOptions options = new ChromeOptions();
// 设置 Chrome 浏览器的二进制文件路径
options.setBinary("/usr/bin/google-chrome");
// 设置启动参数
options.addArguments("--disable-extensions");

// 创建一个 DesiredCapabilities 对象
DesiredCapabilities capabilities = DesiredCapabilities.chrome();
// 设置 ChromeOptions 选项
capabilities.setCapability(ChromeOptions.CAPABILITY, options);

// 使用 DesiredCapabilities 对象创建 ChromeDriver
// 也可以使用 options 直接设置
WebDriver driver = new ChromeDriver(capabilities);

// 访问网站
driver.get("https://www.example.com");

// 关闭浏览器
driver.quit();

2.3.1 控制浏览器

java 复制代码

//控制浏览器
// 设置全屏
driver.manage().window().fullscreen();
//获取当前窗口相对于屏幕左上角的位置。
System.out.println(driver.manage().window().getPosition());
//获取浏览器大小
System.out.println(driver.manage().window().getSize());
//最小化
driver.manage().window().minimize();
//最大化
driver.manage().window().maximize();
//设置窗口大小
driver.manage().window().setSize(...);

2.3.2 模拟鼠标

ActionChains 模拟鼠标
Actions action = new Actions(driver);
contextClick() 右击
clickAndHold() 鼠标点击并控制
doubleClick() 双击
dragAndDrop() 拖动
release() 释放鼠标
dragAndDrop(source, target)：模拟鼠标拖拽拖拽到某个元素然后松开
dragAndDropBy(source, xoffset, yoffset)：模拟鼠标拖拽拖拽到某个坐标然后松开
moveToElement() 模拟鼠标悬停
clickAndHold() 方法用于模拟鼠标悬停操作，在调用时需要指定元素定位
perform() 执行所有Actions中存储的行为
build() 构建所有操作
模拟鼠标移动它是模拟鼠标移动而不是真实的鼠标移动
- moveByOffset()
- moveToElement
- 示例
- action.clickAndHold(WebElement对象).build().perform();

2.3.3 历史记录

java 复制代码

//允许驱动程序访问浏览器的历史记录并导航到给定的URL。
WebDriver.Navigation navigate = driver.navigate();
navigate.refresh();//刷新
navigate.back();//回退
navigate.forward();//向前
navigate.to(..);//跳转URL

2.3.4 窗口切换

java 复制代码

//获取当前打开窗口的所有句柄
Set<String> handles = driver.getWindowHandles();
//获取当前窗口的句柄(String类型)
String handle = driver.getWindowHandle();
//跳转页面，通过窗口句柄，这里使用第一个句柄
driver.switchTo().window(handles.stream().findFirst().orElse(""));
//新开一个窗口
driver.switchTo().newWindow(WindowType.TAB);
driver.get("https://bilibili.com");

java 复制代码

//Cookie 操作
Set<Cookie> cookies = driver.manage().getCookies();
driver.manage().addCookie(null);
driver.manage().deleteAllCookies();
driver.manage().deleteCookieNamed("");
driver.manage().getCookieNamed("");

2.3.6 等待页面加载

我们经常会碰到用selenium操作页面上某个元素的时候，需要等待页面加载完成后，才能操作。否则页面上的元素不存在，会抛出异常。或者碰到AJAX异步加载，我们需要等待元素加载完成后，才能操作。

2.3.6.1 页面加载策略

默认Chrome 浏览器下 所有的元素定位是在页面被完全加载后（页面tab不再转圈）才开始。执行 get 后的代码

在 Selenium 中，可以通过 WebDriver 接口的 manage() 方法来设置页面加载策略。页面加载策略是指当页面处于加载状态时，WebDriver 应该等待多长时间才应该抛出 TimeoutException 异常。以下是几种页面加载策略：

normal：这是默认的页面加载策略。它会等待页面加载完毕，并在超时时间内等待。
eager：这个策略会尝试尽快地完成页面加载，并在超时时间内等待。如果页面在超时时间内没有加载完毕，它会抛出 TimeoutException 异常。
none：这个策略不会等待页面加载完毕，并立即返回。如果您想在页面加载完毕之前执行某些操作，则可以使用这个策略。请注意，如果您在等待操作之前尝试访问页面元素，则可能会抛出 StaleElementReferenceException 异常。

1. 元素出现但页面未加载完毕

首选需要明白的一点是，如果什么都不设置，通常，以chrome浏览器为例，所有的元素定位是在页面被完全加载后（页面tab不再转圈）才开始。

有时候其实想要的元素已经加载出来了，只是页面还在加载其他东西，例如图片，此时若不想继续等待直接执行元素定位操作，则需要在创建driver的时候设置页面加载策略：

当调用driver.get("https://xxxx.xxx.xxx")来访问某页面时，get方法通常会阻塞浏览器直到页面完全加载后才执行后面的动作，若一个页面加载过慢，则会导致get方法一直阻塞。有时候希望页面在加载过程中就开始检测元素是否存在，而不是等到页面加载完了才开始检测，想要实现这个效果，可以用DesiredCapabilities类下的setPageLoadStrategy方法（Python，Chrome浏览器）设置页面加载策略为 none，以便在页面加载期间执行其他操作。接下来，我们使用 WebDriverWait 类等待元素的可见性。在这里，我们等待了最多 10 秒钟，直到元素可见。如果元素在这个时间内没有可见，它会抛出 TimeoutException 异常。

java 复制代码

ChromeOptions options = new ChromeOptions();
options.setPageLoadStrategy(PageLoadStrategy.NONE);
WebDriver driver = new ChromeDriver(options);

driver.get("https://example.com");

//等待页面30s
WebDriverWait wait = new WebDriverWait(driver, Duration.ofSeconds(30));
//指定要等待的元素。
WebElement element = wait.until(ExpectedConditions.visibilityOfElementLocated(By.id("example-id")));
System.out.println("Page element is visible: " + element.isDisplayed());

driver.quit();

2.3.6.2 隐示等待

隐式等待是一种全局等待，它在 WebDriver 对象实例化后设置一次即可，对于整个 WebDriver 实例的生命周期都起作用。

隐式等待的作用是让 WebDriver 在查找页面元素时等待一段时间，如果在等待时间内找到了指定的元素，则立即执行后面的操作。如果等待时间结束仍未找到指定的元素，则抛出 NoSuchElementException 异常。这种等待方式适用于那些需要加载一些资源（例如 JavaScript、图片等）的页面，因为这些资源可能会影响页面元素的加载速度。driver.manage().timeouts().implicitlyWait(10, TimeUnit.SECONDS);

java 复制代码

// 设置 Chrome 浏览器驱动路径
System.setProperty("webdriver.chrome.driver", "/path/to/chromedriver");
// 创建 ChromeDriver 实例
WebDriver driver = new ChromeDriver();

// 设置隐式等待时间为 10 秒
driver.manage().timeouts().implicitlyWait(10, TimeUnit.SECONDS);

// 访问网站
driver.get("https://www.example.com");

// 查找并操作页面元素
WebElement element = driver.findElement(By.id("example-id"));
element.click();

// 关闭浏览器
driver.quit();

2.3.6.3 显示等待

显示等待是一种精确控制等待时间的等待方式，它可以让我们在指定时间内等待某个条件的成立。与隐式等待不同，显式等待是在代码中手动编写的，需要指定等待的最长时间，以及判断条件的类型和条件值。当等待时间内判断条件成立，则立即执行后续的操作，否则在等待时间到达后抛出异常。

Selenium WebDriver 提供了一个名为 WebDriverWait 的类来实现显式等待。使用 WebDriverWait 可以指定等待的最长时间和等待条件，常用的等待条件包括 elementToBeClickable、presenceOfElementLocated、visibilityOfElementLocated 等等。

java 复制代码

// 设置 Chrome 浏览器驱动路径
System.setProperty("webdriver.chrome.driver", "/path/to/chromedriver");
// 创建 ChromeDriver 实例
WebDriver driver = new ChromeDriver();

// 访问网站
driver.get("https://www.example.com");

// 显式等待页面元素加载完成
WebDriverWait wait = new WebDriverWait(driver, 10);
//ExpectedConditions.visibilityOfElementLocated 方法来指定等待条件为指定元素的可见性。如果等待时间内指定元素的可见性成立，则 wait.until 方法立即返回找到的页面元素，并执行后续的操作；如果等待时间到达后仍未找到指定元素，则抛出 TimeoutException 异常。
//ExpectedConditions 提供的各种判断条件。WebElement element = wait.until(ExpectedConditions.condition());
WebElement element = wait.until(ExpectedConditions.visibilityOfElementLocated(By.id("example-id")));

// 对页面元素进行操作
element.click();

// 关闭浏览器
driver.quit();

2.3.6.4 流畅等待

FluentWait是WebDriver提供的另一种等待方式，用于在指定时间内以一定的时间间隔不断地进行条件判断，直到超时或者条件成立为止。与WebDriverWait相比，FluentWait更加灵活，可以根据具体需求自定义等待时间和等待条件，适用于一些比较特殊的场景。

使用FluentWait需要先定义等待条件（ExpectedCondition对象）和等待时间间隔，然后将它们传入FluentWait的构造方法中，最后调用until方法即可。与显示等待的 WebDriverWait类似，区别是WebDriverWait已经设置好几个等待条件，而流畅等待 FluentWait可以自己设置等待条件。

java 复制代码

FluentWait<WebDriver> wait = new FluentWait<>(driver)
        .withTimeout(Duration.ofSeconds(10)) // 设置超时时间为10秒
        .pollingEvery(Duration.ofSeconds(1)) // 每隔1秒检测一次
        .ignoring(NoSuchElementException.class); // 忽略NoSuchElementException异常

WebElement element = wait.until(ExpectedConditions.visibilityOfElementLocated(By.id("example-id")));

2.3.7 定位方式

根据元素ID进行定位

java 复制代码

driver.findElement(By.id("element-id"));

根据元素名称进行定位

java 复制代码

driver.findElement(By.name("element-name"));

根据链接文本进行定位

java 复制代码

driver.findElement(By.linkText("link-text"));

根据部分链接文本进行定位

java 复制代码

driver.findElement(By.partialLinkText("partial-link-text"));

根据元素标签名称进行定位

java 复制代码

driver.findElement(By.tagName("tag-name"));

根据CSS选择器进行定位

java 复制代码

driver.findElement(By.cssSelector("selector"));

根据XPath表达式进行定位

java 复制代码

driver.findElement(By.xpath("xpath-expression"));

根据元素类名进行定位

java 复制代码

driver.findElement(By.className("class-name"));

需要注意的是，不同的定位方式的效率和适用场景也不同，需要根据实际情况选择合适的定位方式。另外，还可以使用复合定位方式，将多种定位方式组合使用来定位元素。

2.3.7.1 css定位

根据CSS选择器进行定位是Selenium中常用的一种方式，可以通过使用 By.cssSelector() 方法实现。

在使用CSS选择器进行定位时，可以通过元素的id、class、属性和标签名称等信息来定位元素。下面是一些常用的CSS选择器示例：

通过id定位元素

driver.findElement(By.cssSelector("#element-id"));
通过class定位元素

driver.findElement(By.cssSelector(".element-class"));
通过属性定位元素

driver.findElement(By.cssSelector("[attribute-name='attribute-value']"));
通过标签名称定位元素

driver.findElement(By.cssSelector("tag-name"));
通过组合选择器定位元素

driver.findElement(By.cssSelector("tag-name#element-id.attribute-name[attribute-value]"));
子选择器

使用>符号来选择作为某元素子元素的元素，例如：

复制代码

driver.findElement(By.cssSelector("parent-element > child-element"));

后代选择器

使用空格符号来选择某元素后代元素，例如：

复制代码

driver.findElement(By.cssSelector("parent-element child-element"));

相邻兄弟选择器

使用+符号来选择某元素之后相邻的兄弟元素，例如：

复制代码

driver.findElement(By.cssSelector("preceding-element + sibling-element"));

通用兄弟选择器

使用~符号来选择某元素之后的兄弟元素，例如：

复制代码

driver.findElement(By.cssSelector("preceding-element ~ sibling-element"));

需要注意的是，在使用CSS选择器进行定位时，需要确保选择器的唯一性，否则可能会定位到不符合预期的元素。同时，还需要注意选择器的复杂度和性能问题。在定位复杂的元素时，建议优先考虑使用XPath表达式进行定位。

2.3.8 获取页面源代码

Java

java 复制代码

driver.getPageSource()

java 复制代码

// 注入JavaScript脚本
String script = "return document.documentElement.outerHTML;";
String pageSource = (String) ((JavascriptExecutor) driver).executeScript(script);

2.3.9 打开相同的浏览器（来自于网络）

在使用 Selenium 进行自动化测试时，如果希望在每次运行脚本时打开相同的浏览器，可以使用 WebDriver 的 SessionId 属性来实现。

首先，打开浏览器并执行测试代码，可以通过 driver.getSessionId() 方法获取当前浏览器会话的 SessionId 值。然后，在下一次运行测试脚本时，可以使用 WebDriver 的 attach 方法，传入上一次运行时获取的 SessionId 值，即可重新打开相同的浏览器并继续测试。

以下是使用 Java 实现上述方法的示例代码：

java 复制代码

// 第一次打开浏览器并执行测试代码
WebDriver driver = new ChromeDriver();
driver.get("https://www.example.com");
String sessionId = driver.getSessionId().toString();
driver.quit();

// 下一次打开相同的浏览器并继续测试
ChromeOptions options = new ChromeOptions();
options.setExperimentalOption("debuggerAddress", "localhost:9222");
WebDriver driver = new ChromeDriver(options);
driver = new ChromeDriver(options);
driver.get("https://www.example.com");
RemoteWebDriver remoteWebDriver = (RemoteWebDriver) driver;
remoteWebDriver.executeScript("window.open('about:blank', '_blank');");
remoteWebDriver.switchTo().window(remoteWebDriver.getWindowHandles().stream().skip(1).findFirst().get());
remoteWebDriver.get("http://localhost:9222/json/new?"+sessionId);
remoteWebDriver.switchTo().window(remoteWebDriver.getWindowHandles().stream().findFirst().get());

需要注意的是，在上述代码中，需要事先在命令行启动一个 Chrome 浏览器实例，并启用远程调试模式。在启动浏览器实例时，需要使用 --remote-debugging-port 参数指定一个空闲的端口号，如 9222。在运行测试脚本时，需要将 ChromeOptions 实例的 debuggerAddress 属性设置为 localhost:9222，表示连接到远程调试端口。在连接上一个已有的浏览器实例后，需要调用 window.open() 方法打开一个新的空白窗口，并切换到该窗口，最后通过 http://localhost:9222/json/new?sessionId URL 加载之前会话的 SessionId 值，以恢复之前浏览器会话的状态。

2.3.10 启动参数设置

java 复制代码

// Chrome
options = new ChromeOptions();
// 启动就最大化
// options.addArguments("start-fullscreen");
// options.addArguments("--start-maximized");
// 禁用浏览器弹出窗口拦截器。
options.addArguments("--disable-popup-blocking");
// 取消沙盘模式
options.addArguments("no-sandbox");
//禁用 Chrome 的 /dev/shm 空间，在一些低配服务器上可能会导致 Chrome 崩溃。
options.addArguments("--disable-dev-shm-usage");
// 禁止扩展
options.addArguments("disable-extensions");
// 禁止默认浏览器检查
options.addArguments("no-default-browser-check");
options.addArguments("about:histograms");
options.addArguments("about:cache");
// 设置浏览器固定大小
// 注意：设定了浏览器固定大小后，浏览器打开后浏览器的位置可能会变到其他位置，因此可以使用设置刘浏览器的位置方法和设置浏览器的大小方法一起使用；driver.manage().window().maximize();
options.addArguments("--window-size=1600,900");
// chrome正受到自动测试软件的控制
options.addArguments("disable-infobars");

//谷歌插件 注意对于路径都要使用 new File(...).getCanonicalPath();或者使用相对路径
options.addExtensions(new File("/path/to/extension.crx"))
options.setBinary(new File("/path/to/chrome"));
// 禁用 GPU 硬件加速，可以避免一些图形渲染问题和内存泄漏问题。
options.addArguments("--disable-gpu");
//用户工作目录（缓存地址）
options.addArguments("--user-data-dir="+new File("./cache/user/user1").getCanonicalPath());

//每当我们使用selenium启动chrome浏览器时，将为每个新会话创建一个新实例/临时配置文件。如果我们要加载默认的Chrome浏览器或自定义Chrome配置文件，
//我们可以将'user-data-dir'参数传递给ChromeOptions，这是Chrome命令行切换，告诉Chrome使用哪个配置文件。如果路径不存在，chrome将在指定的路径中创建新的配置文件。
options.addArgument("user-data-dir=/path/to/your/custom/profile");

//无头浏览器
options.addArguments("--headless");
//禁用浏览器的同源策略，允许在同一网站内加载来自多个域的资源。
options.addArguments("--disable-web-security");
//设置浏览器的 User-Agent 字符串，可以用来伪装浏览器类型和版本。
options.addArguments("--user-agent=Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3");

//性能优化
options.addArguments("--disable-extensions");//禁用 Chrome 扩展程序。
options.addArguments("--no-sandbox");//高危
options.addArguments("--blink-settings=imagesEnabled=false");//禁用浏览器中的图片加载，可以加快浏览器的渲染速度。
options.addArguments("--disable-features=IsolateOrigins,site-per-process");//高危
options.addArguments("--disable-features=VizDisplayCompositor");//高危
options.addArguments("--disable-features=RendererCodeIntegrity");//高危
options.addArguments("--disable-blink-features=AutomationControlled");// 高危
options.addArguments("--mute-audio");// 禁用浏览器声音。
options.setExperimentalOption("excludeSwitches", Collections.singletonList("enable-automation")); //禁用自动化标识
options.setExperimentalOption("useAutomationExtension", false);// 禁用拓展程序
//不禁用 CSS 的情况下，将网页加载为无样式的版本，从而提高性能。注意这设置了UA
options.addArguments("--user-agent=Googlebot");
options.addArguments("--disable-javascript");//禁用JavaScript
options.addArguments("--disable-blink-features=CSSAnimations");//禁用CSS动画
options.addArguments("--disable-blink-features=CSSTransitions");//禁用CSS过渡

其他

--disable-notifications: 禁用浏览器通知。

--disable-popup-blocking: 禁用浏览器弹出窗口拦截器。

--disable-default-apps: 禁用默认应用程序。

--hide-scrollbars: 隐藏浏览器滚动条。

--mute-audio: 禁用浏览器声音。

--log-level=3: 设置浏览器的日志级别为 WARNING。

--disable-logging: 禁用浏览器日志输出。

setExperimentalOption("useAutomationExtension", false): 禁用 Chrome 扩展程序，用于避免一些自动化测试过程中出现的问题。

setExperimentalOption("excludeSwitches", Collections.singletonList("enable-automation")): 禁用 Chrome 的自动化开关，也是用于避免自动化测试过程中出现的问题。这行代码会禁用 Chrome 的自动化开关。当启用自动化测试时，Chrome 会自动开启一个特殊的标志"enable-automation"，这个标志可能会导致一些网站行为异常或者被检测到并阻止自动化测试。因此，在执行自动化测试时，禁用此开关可以避免这些问题的发生。

setExperimentalOption("prefs", prefs): 设置 Chrome 的偏好选项。方法可以设置 Chrome 浏览器的偏好选项。在这个方法中，prefs参数是一个 Map<String, Object> 对象，其中包含一些键值对，用于设置浏览器的偏好选项。

偏好选项可以用来控制浏览器的一些行为，例如下载文件的默认路径、启用 Flash 插件、禁用自动填充表单等。通过设置偏好选项，可以使自动化测试脚本更加灵活和可控。

--disable-browser-side-navigation: 禁用浏览器侧边导航。

--disable-features=VizDisplayCompositor: 禁用 Chrome 的某个功能，可以提高 Chrome 的性能。这个功能用于渲染页面的图形界面，禁用它可以提高 Chrome 的性能，但可能会影响页面的显示效果。

--disable-features=RendererCodeIntegrity: 禁用 Chrome 的某个功能，可以提高 Chrome 的性能。这个功能用于保护渲染器进程不被攻击者利用，但它会消耗一些额外的性能，禁用它可以提高 Chrome 的性能。

--blink-settings=imagesEnabled=false: 禁用浏览器中的图片加载，可以加快浏览器的渲染速度。

--disable-blink-features=AutomationControlled: 禁用 Blink 引擎自动化控制的功能。可以禁用 Chrome 浏览器中 Blink 引擎的自动化控制功能，使得一些原本受到限制的操作变得可行。但需要注意的是，禁用这个功能可能会导致一些不安全的操作被执行，因此需要谨慎使用。

--disable-features=IsolateOrigins,site-per-process: 禁用 Chrome 的网站隔离和进程隔离功能，可以提高性能和减少内存占用。

--remote-debugging-port=9222: 开启 Chrome 的远程调试端口。

--disable-extensions: 禁用 Chrome 扩展程序。

--disable-web-security: 禁用 Chrome 的同源策略，允许在同一网站内加载来自多个域的资源。

--disable-features=CSSGridLayout。启用该参数后，Chrome 浏览器将不会使用 CSS 网格布局来排版页面，可能会提高页面加载速度和浏览器性能，但也会导致网页排版样式异常。

2.3.11 执行 JS

在Java中使用Selenium执行JavaScript可以使用JavascriptExecutor接口。这个接口可以在Selenium WebDriver对象上使用

jav 复制代码

System.setProperty("webdriver.chrome.driver", "path/to/chromedriver");
WebDriver driver = new ChromeDriver();

driver.get("http://www.example.com");

JavascriptExecutor js = (JavascriptExecutor) driver;

// 在页面上执行JavaScript
js.executeScript("alert('Hello World!');");

driver.quit();

如何处理js的返回值: 接收返回值，根据 Class 进行强制转换

java 复制代码

Object o = js.executeScript("return 1+1");
//class java.lang.Long
System.out.println(o.getClass());
if (o instanceof  Long){
    Long l = (Long)o;
    // ........
}

2.3.12 关闭日志

您使用的是其他日志框架，例如 log4j 或 logback，则需要查找该框架提供的特定方法或配置来关闭日志记录。通常，这些框架都提供了一些级别配置，您可以将其设置为"OFF"或"ERROR"来关闭日志记录。

2.3.13 截图

java 复制代码

//截取全屏
File scrFile  = ((TakesScreenshot)webDriver).getScreenshotAs(OutputType.FILE);
//在全屏图片下裁剪
BufferedImage img = ImageIO.read(scrFile);
BufferedImage dest = img.getSubimage(p.getX(), p.getY(),rec.getWidth(),rec.getHeight());
ImageIO.write(dest, "png", scrFile);
//拷贝文件
FileUtils.copyFile(scrFile , new File("a.png"));
log.info("截图完成");

File screenshotFile = ((TakesScreenshot) webDriver).getScreenshotAs(OutputType.FILE);

这行代码使用了 TakesScreenshot 接口中的 getScreenshotAs 方法来获取元素的屏幕截图。 getScreenshotAs 方法接受一个参数，即 OutputType，用于指定截图的类型。在这里，我们使用了 OutputType.FILE 来指定截图以文件形式返回。

TakesScreenshot 接口是一个由 WebDriver 实现的接口，它允许您获取 WebDriver 实例的屏幕截图。通过将 WebDriver 实例转换为 TakesScreenshot 接口类型，您可以调用 getScreenshotAs 方法来获取屏幕截图。但是，请注意，如果您传递的是一个 WebElement 对象而不是 WebDriver 实例，那么将会截取该元素的屏幕截图，而不是整个页面的截图。

另外，由于 getScreenshotAs 方法返回的是一个 File 类型的对象，您需要使用 Java 的 FileUtils 类或其他类库来将截图保存到本地文件中。在上面的代码中，我们使用了 Apache Commons IO 库中的 FileUtils 类来复制文件

2.3.14 插件（来自网络）

控制浏览器插件的方式取决于您使用的浏览器和插件类型。下面是一些常见浏览器插件的控制方式：

AdBlock Plus：使用 AdBlock Plus 的 org.openqa.selenium.chrome.ChromeOptions 类和 addExtensions 方法来加载插件。示例代码如下：

javaCopy codeChromeOptions options = new ChromeOptions();
options.addExtensions(new File("/path/to/adblockplus.crx"));
WebDriver driver = new ChromeDriver(options);
uBlock Origin：使用 uBlock Origin 的 org.openqa.selenium.chrome.ChromeOptions 类和 addExtensions 方法来加载插件。示例代码如下：

javaCopy codeChromeOptions options = new ChromeOptions();
options.addExtensions(new File("/path/to/ublockorigin.crx"));
WebDriver driver = new ChromeDriver(options);
Firebug：使用 Firefox 的 org.openqa.selenium.firefox.FirefoxProfile 类和 addExtension 方法来加载插件。示例代码如下：

javaCopy codeFirefoxProfile profile = new FirefoxProfile();
File firebug = new File("/path/to/firebug.xpi");
File netExport = new File("/path/to/netExport.xpi");
profile.addExtension(firebug);
profile.addExtension(netExport);
WebDriver driver = new FirefoxDriver(profile);

在上面的代码中，我们使用了 Firefox 的 addExtension 方法来加载 Firebug 插件和 NetExport 插件。

请注意，加载浏览器插件可能会对浏览器性能产生一定影响，因此请谨慎使用。此外，不同版本的浏览器和插件可能需要不同的加载方式，请根据您的具体情况进行调整。

Java/Kotlin 使用 Chrome 无头浏览器

1. 概念

1.2 与传统的Http 库做爬虫对比

1.3 无头浏览器一览

1.4. 自动化配置环境

2.1 引入依赖：

2.2 下载 Chromium/ChromiumDriver

2.3 访问百度

小工具

2.Headless Chrome

2.1 环境搭建

2.1.1 安装Chrome

2.1.2 启动浏览器

2.1.3 下载chromedriver

2.1.4 配置 chromedriver 的环境变量

2.1.5 添加依赖

2.1.6 代码启动浏览器

2.2 报错

2.3 项目实例

2.3.0 设置WebDriver

2.3.1 控制浏览器

2.3.2 模拟鼠标

2.3.3 历史记录

2.3.4 窗口切换

2.3.5 Cookie

2.3.6 等待页面加载

2.3.6.1 页面加载策略

2.3.6.2 隐示等待

2.3.6.3 显示等待

2.3.6.4 流畅等待

2.3.7 定位方式

2.3.7.1 css定位

2.3.8 获取页面源代码

2.3.9 打开相同的浏览器（来自于网络）

2.3.10 启动参数设置

2.3.11 执行 JS

2.3.12 关闭日志

2.3.13 截图

2.3.14 插件（来自网络）