Selenium 自动化截取网页指定区域截图

一. 需求

在本篇博客中,我将分享一段使用Python编写的自动化网页截图代码,该代码基于Selenium和PIL库,可用于截取网页中指定区域的截图。这样的功能对于需要定期监控特定网页内容或进行网页数据采集的任务非常有用。

二. 代码解析

首先,我们使用Selenium库启动了一个Chrome浏览器,并通过设置选项隐藏了浏览器自动化控制提示。代码还实现了全屏效果,类似于按下F11键。

python 复制代码
import time
from selenium import webdriver
from PIL import Image

# 启动浏览器
chrome_options = webdriver.ChromeOptions()
# 隐藏浏览器自动化控制提示
chrome_options.add_experimental_option('excludeSwitches', ['enable-automation'])

# 添加谷歌浏览器驱动位置
# chrome_options.binary_location = r"E:\应用\谷歌浏览器插件\chrome-win64\chrome.exe"

# 加载启动项页面全屏效果,相当于F11。
chrome_options.add_argument("--kiosk")

# 配置初始化
driver = webdriver.Chrome(options=chrome_options)

然后,我们打开了指定的网页,并获取了页面的宽度和高度。

python 复制代码
# 打开页面
url = 'https://baidu.com'  # 请替换为你要打开的页面
driver.get(url)

# 获取页面宽度与高度
hight,width = 'return document.body.clientHeight','return document.body.clientWidth'
h,w = driver.execute_script(hight),driver.execute_script(width)
print(w,h)

接下来,我们指定了要截取的区域的坐标,并使用Selenium的save_screenshot方法保存整个页面的截图。

python 复制代码
# 指定四个点的坐标,这里以左上角和右下角的坐标为例
# x1起始宽度到 x2最大宽度的距离
# y1起始高度到 y2最大高度的距离
x1, y1 = 0, 0  # 左上角坐标
x2, y2 = w, h-600  # 右下角坐标

# 获取整个页面截图
screenshot_path = 'screenshot.png'
driver.save_screenshot(screenshot_path)

随后,我们使用PIL库打开整个页面的截图,并通过crop方法截取指定区域。最后,保存截取的区域截图及关闭浏览器

python 复制代码
# 截取指定区域
im = Image.open(screenshot_path)
region = im.crop((x1, y1, x2, y2))

# 保存截图
cropped_path = 'result_screenshot.png'
region.save(cropped_path)

# 关闭浏览器
driver.close()

三. 总结

1. 完整代码

python 复制代码
import time

from selenium import webdriver
from PIL import Image

# 启动浏览器
# 隐藏浏览器自动化控制提示
chrome_options = webdriver.ChromeOptions()
chrome_options.add_experimental_option('excludeSwitches', ['enable-automation'])

# 添加谷歌浏览器驱动位置
# chrome_options.binary_location = r"E:\应用\谷歌浏览器插件\chrome-win64\chrome.exe"

# 加载启动项页面全屏效果,相当于F11。
chrome_options.add_argument("--kiosk")

# 配置初始化
driver = webdriver.Chrome(options=chrome_options)

# 打开页面
url = 'https://baidu.com'  # 请替换为你要打开的页面
driver.get(url)


# 获取页面宽度与高度
hight,width = 'return document.body.clientHeight','return document.body.clientWidth'
h,w = driver.execute_script(hight),driver.execute_script(width)
print(w,h)

# 指定四个点的坐标,这里以左上角和右下角的坐标为例
# x1起始宽度到 x2最大宽度的距离
# y1起始高度到 y2最大高度的距离
x1, y1 = 0, 0  # 左上角坐标
x2, y2 = w, h-600  # 右下角坐标

# 获取整个页面截图
screenshot_path = 'screenshot.png'
driver.save_screenshot(screenshot_path)

time.sleep(3)

# 截取指定区域
im = Image.open(screenshot_path)
region = im.crop((x1, y1, x2, y2))

# 保存截图
cropped_path = 'result_screenshot.png'
region.save(cropped_path)

# 关闭浏览器
driver.close()
  • 将代码中的网页链接和截取区域坐标调整为你想要的值。

  • 运行代码,即可生成指定区域的网页截图。

相关推荐
紫雾凌寒1 小时前
计算机视觉 |解锁视频理解三剑客——TimeSformer
python·深度学习·神经网络·计算机视觉·transformer·timesformer
程序员杰哥2 小时前
测试用例详解
自动化测试·软件测试·python·功能测试·测试工具·职场和发展·测试用例
go54631584657 小时前
本地部署 GitHub 上的 Python 人脸识别项目
开发语言·python·github
FreakStudio8 小时前
手把手教你用 MicroPython 玩转幻尔串口舵机,代码+教程全公开
python·嵌入式·大学生·面向对象·技术栈·电子diy·电子计算机
tekin8 小时前
基于 Python 开发在线多人游戏服务器案例解析
服务器·python·游戏·在线多人游戏服务器
让学习成为一种生活方式10 小时前
libGL.so.1: cannot open shared object file: No such file or directory-linux022
linux·开发语言·python
java1234_小锋11 小时前
一周学会Flask3 Python Web开发-Jinja2模板继承和include标签使用
python·flask·flask3
图书馆钉子户11 小时前
from flask_session import Session 为什么是Session(app)这么用?
python·flask·mybatis
一只蜗牛儿11 小时前
Sherpa-ONNX:说话人识别与语音识别自动开启(VAD)+ Python API 完整指南
人工智能·python·语音识别
结衣结衣.11 小时前
【OpenCV】入门教学
图像处理·人工智能·python·opencv