[python opencv video抠图并更换背景]

完整实现

  • 可以对前景进行缩放

  • 可以对前景进行平移

python 复制代码
import cv2
import numpy as np


def adjust_img(img, position_params, size_rate):
    """调整图像
    必须先缩小-再平移

    :param img:
    :param position_params:
    :param size_rate:
    :return:
    """
    h, w = img.shape[:2]

    # 进行缩放
    new_size = [int(size_rate * h), int(size_rate * w)]
    img = cv2.resize(img, (new_size[1], new_size[0]))
    if w >= new_size[1]:
        pad_w = w - new_size[1]
        pad_h = h - new_size[0]
        top, bottom = pad_h // 2, pad_h - (pad_h // 2)
        left, right = pad_w // 2, pad_w - (pad_w // 2)
        img = cv2.copyMakeBorder(img, top, bottom, left, right, cv2.BORDER_CONSTANT,
                                 None,
                                 (0, 0, 0))
    else:
        crop_w = (new_size[1] - w) // 2
        crop_h = (new_size[0] - h) // 2

        img = img[crop_h:crop_h + h, crop_w:crop_w + w]

    # 进行平移
    MAT = np.float32(
        [[1, 0, int(w * position_params[1])], [0, 1, int(h * position_params[0])]])  # 构造平移变换矩阵
    img = cv2.warpAffine(img, MAT, (w, h), borderValue=(0, 0, 0))  # 设置白色填充

    return img


def video_compositing(video_root, mask_root, output_path, background_root, position_params,
                      size_rate):
    """

    :param video_root:
    :param mask_root: mask path
    :param output_path: 输出位置
    :param background_root: 背景图像path
    :param position_params: [0.5, 0.5], [垂直,水平]控制人像在图像中的位置, 计算例如:水平移动像素数/水平像素总数
    :param size_rate: 控制缩放大小,1:原始大小
    :return:
    """

    video = cv2.VideoCapture(video_root)
    mask = cv2.VideoCapture(mask_root)

    if not video.isOpened():
        print(f"Failed to open video file: {video_root}")
        return

    if not mask.isOpened():
        print(f"Failed to open mask file: {mask_root}")
        return

    rval, frame = video.read()
    rval_mask, frame_mask = mask.read()

    fps = video.get(cv2.CAP_PROP_FPS)
    h, w = frame.shape[:2]

    fourcc = cv2.VideoWriter_fourcc(*'mp4v')
    video_writer = cv2.VideoWriter(output_path, fourcc, fps, (w, h))
    num_frame = video.get(cv2.CAP_PROP_FRAME_COUNT)

    # 是否加背景
    if background_root:
        background = cv2.imread(background_root)
        background = cv2.resize(background, (w, h))
    else:
        background = None

    for c in range(int(num_frame)):
        if (frame is None) or (frame_mask is None):
            continue

        # 计算前景
        foreground = frame * (frame_mask / 255)
        foreground = adjust_img(foreground, position_params, size_rate)

        # 是否加背景
        if background_root:
            frame_mask = adjust_img(frame_mask, position_params, size_rate)
            fg_com = foreground + background * (1 - frame_mask / 255)
        else:
            fg_com = foreground

        video_writer.write(fg_com.astype(np.uint8))
        rval, frame = video.read()
        rval_mask, frame_mask = mask.read()

    video_writer.release()

运行测试

python 复制代码
video_compositing(
    'data/video.mp4',
    'data/mask.mp4',
    'data/results.mp4',
    'data/img.jpg',
    position_params=[0., 0.3],  # 垂直,水平
    size_rate=1.8
)
相关推荐
Python×CATIA工业智造2 小时前
Frida RPC高级应用:动态模拟执行Android so文件实战指南
开发语言·python·pycharm
onceco2 小时前
领域LLM九讲——第5讲 为什么选择OpenManus而不是QwenAgent(附LLM免费api邀请码)
人工智能·python·深度学习·语言模型·自然语言处理·自动化
狐凄3 小时前
Python实例题:基于 Python 的简单聊天机器人
开发语言·python
悦悦子a啊4 小时前
Python之--基本知识
开发语言·前端·python
whoarethenext5 小时前
使用 C++/OpenCV 和 MFCC 构建双重认证智能门禁系统
开发语言·c++·opencv·mfcc
jndingxin5 小时前
OpenCV CUDA模块设备层-----高效地计算两个 uint 类型值的带权重平均值
人工智能·opencv·计算机视觉
笑稀了的野生俊6 小时前
在服务器中下载 HuggingFace 模型:终极指南
linux·服务器·python·bash·gpu算力
Naiva6 小时前
【小技巧】Python+PyCharm IDE 配置解释器出错,环境配置不完整或不兼容。(小智AI、MCP、聚合数据、实时新闻查询、NBA赛事查询)
ide·python·pycharm
晨同学03276 小时前
opencv的颜色通道问题 & rgb & bgr
人工智能·opencv·计算机视觉
路来了6 小时前
Python小工具之PDF合并
开发语言·windows·python