Selenium 自动化截取网页指定区域截图

一. 需求

在本篇博客中,我将分享一段使用Python编写的自动化网页截图代码,该代码基于Selenium和PIL库,可用于截取网页中指定区域的截图。这样的功能对于需要定期监控特定网页内容或进行网页数据采集的任务非常有用。

二. 代码解析

首先,我们使用Selenium库启动了一个Chrome浏览器,并通过设置选项隐藏了浏览器自动化控制提示。代码还实现了全屏效果,类似于按下F11键。

python 复制代码
import time
from selenium import webdriver
from PIL import Image

# 启动浏览器
chrome_options = webdriver.ChromeOptions()
# 隐藏浏览器自动化控制提示
chrome_options.add_experimental_option('excludeSwitches', ['enable-automation'])

# 添加谷歌浏览器驱动位置
# chrome_options.binary_location = r"E:\应用\谷歌浏览器插件\chrome-win64\chrome.exe"

# 加载启动项页面全屏效果,相当于F11。
chrome_options.add_argument("--kiosk")

# 配置初始化
driver = webdriver.Chrome(options=chrome_options)

然后,我们打开了指定的网页,并获取了页面的宽度和高度。

python 复制代码
# 打开页面
url = 'https://baidu.com'  # 请替换为你要打开的页面
driver.get(url)

# 获取页面宽度与高度
hight,width = 'return document.body.clientHeight','return document.body.clientWidth'
h,w = driver.execute_script(hight),driver.execute_script(width)
print(w,h)

接下来,我们指定了要截取的区域的坐标,并使用Selenium的save_screenshot方法保存整个页面的截图。

python 复制代码
# 指定四个点的坐标,这里以左上角和右下角的坐标为例
# x1起始宽度到 x2最大宽度的距离
# y1起始高度到 y2最大高度的距离
x1, y1 = 0, 0  # 左上角坐标
x2, y2 = w, h-600  # 右下角坐标

# 获取整个页面截图
screenshot_path = 'screenshot.png'
driver.save_screenshot(screenshot_path)

随后,我们使用PIL库打开整个页面的截图,并通过crop方法截取指定区域。最后,保存截取的区域截图及关闭浏览器

python 复制代码
# 截取指定区域
im = Image.open(screenshot_path)
region = im.crop((x1, y1, x2, y2))

# 保存截图
cropped_path = 'result_screenshot.png'
region.save(cropped_path)

# 关闭浏览器
driver.close()

三. 总结

1. 完整代码

python 复制代码
import time

from selenium import webdriver
from PIL import Image

# 启动浏览器
# 隐藏浏览器自动化控制提示
chrome_options = webdriver.ChromeOptions()
chrome_options.add_experimental_option('excludeSwitches', ['enable-automation'])

# 添加谷歌浏览器驱动位置
# chrome_options.binary_location = r"E:\应用\谷歌浏览器插件\chrome-win64\chrome.exe"

# 加载启动项页面全屏效果,相当于F11。
chrome_options.add_argument("--kiosk")

# 配置初始化
driver = webdriver.Chrome(options=chrome_options)

# 打开页面
url = 'https://baidu.com'  # 请替换为你要打开的页面
driver.get(url)


# 获取页面宽度与高度
hight,width = 'return document.body.clientHeight','return document.body.clientWidth'
h,w = driver.execute_script(hight),driver.execute_script(width)
print(w,h)

# 指定四个点的坐标,这里以左上角和右下角的坐标为例
# x1起始宽度到 x2最大宽度的距离
# y1起始高度到 y2最大高度的距离
x1, y1 = 0, 0  # 左上角坐标
x2, y2 = w, h-600  # 右下角坐标

# 获取整个页面截图
screenshot_path = 'screenshot.png'
driver.save_screenshot(screenshot_path)

time.sleep(3)

# 截取指定区域
im = Image.open(screenshot_path)
region = im.crop((x1, y1, x2, y2))

# 保存截图
cropped_path = 'result_screenshot.png'
region.save(cropped_path)

# 关闭浏览器
driver.close()
  • 将代码中的网页链接和截取区域坐标调整为你想要的值。

  • 运行代码,即可生成指定区域的网页截图。

相关推荐
小han的日常1 分钟前
pycharm分支提交操作
python·pycharm
明月清风徐徐20 分钟前
Scrapy爬取豆瓣电影Top250排行榜
python·selenium·scrapy
theLuckyLong21 分钟前
SpringBoot后端解决跨域问题
spring boot·后端·python
Yongqiang Cheng24 分钟前
Python operator.itemgetter(item) and operator.itemgetter(*items)
python·operator·itemgetter
MavenTalk27 分钟前
Move开发语言在区块链的开发与应用
开发语言·python·rust·区块链·solidity·move
FksLiao39 分钟前
Superset安装
python
L Jiawen1 小时前
【Python · PyTorch】卷积神经网络(基础概念)
pytorch·python·cnn
goomind1 小时前
深度学习模型评价指标介绍
人工智能·python·深度学习·计算机视觉
->yjy1 小时前
wordcloud库基本介绍
python
2401_840192271 小时前
python基础大杂烩
linux·开发语言·python