[python opencv video抠图并更换背景]

完整实现

  • 可以对前景进行缩放

  • 可以对前景进行平移

python 复制代码
import cv2
import numpy as np


def adjust_img(img, position_params, size_rate):
    """调整图像
    必须先缩小-再平移

    :param img:
    :param position_params:
    :param size_rate:
    :return:
    """
    h, w = img.shape[:2]

    # 进行缩放
    new_size = [int(size_rate * h), int(size_rate * w)]
    img = cv2.resize(img, (new_size[1], new_size[0]))
    if w >= new_size[1]:
        pad_w = w - new_size[1]
        pad_h = h - new_size[0]
        top, bottom = pad_h // 2, pad_h - (pad_h // 2)
        left, right = pad_w // 2, pad_w - (pad_w // 2)
        img = cv2.copyMakeBorder(img, top, bottom, left, right, cv2.BORDER_CONSTANT,
                                 None,
                                 (0, 0, 0))
    else:
        crop_w = (new_size[1] - w) // 2
        crop_h = (new_size[0] - h) // 2

        img = img[crop_h:crop_h + h, crop_w:crop_w + w]

    # 进行平移
    MAT = np.float32(
        [[1, 0, int(w * position_params[1])], [0, 1, int(h * position_params[0])]])  # 构造平移变换矩阵
    img = cv2.warpAffine(img, MAT, (w, h), borderValue=(0, 0, 0))  # 设置白色填充

    return img


def video_compositing(video_root, mask_root, output_path, background_root, position_params,
                      size_rate):
    """

    :param video_root:
    :param mask_root: mask path
    :param output_path: 输出位置
    :param background_root: 背景图像path
    :param position_params: [0.5, 0.5], [垂直,水平]控制人像在图像中的位置, 计算例如:水平移动像素数/水平像素总数
    :param size_rate: 控制缩放大小,1:原始大小
    :return:
    """

    video = cv2.VideoCapture(video_root)
    mask = cv2.VideoCapture(mask_root)

    if not video.isOpened():
        print(f"Failed to open video file: {video_root}")
        return

    if not mask.isOpened():
        print(f"Failed to open mask file: {mask_root}")
        return

    rval, frame = video.read()
    rval_mask, frame_mask = mask.read()

    fps = video.get(cv2.CAP_PROP_FPS)
    h, w = frame.shape[:2]

    fourcc = cv2.VideoWriter_fourcc(*'mp4v')
    video_writer = cv2.VideoWriter(output_path, fourcc, fps, (w, h))
    num_frame = video.get(cv2.CAP_PROP_FRAME_COUNT)

    # 是否加背景
    if background_root:
        background = cv2.imread(background_root)
        background = cv2.resize(background, (w, h))
    else:
        background = None

    for c in range(int(num_frame)):
        if (frame is None) or (frame_mask is None):
            continue

        # 计算前景
        foreground = frame * (frame_mask / 255)
        foreground = adjust_img(foreground, position_params, size_rate)

        # 是否加背景
        if background_root:
            frame_mask = adjust_img(frame_mask, position_params, size_rate)
            fg_com = foreground + background * (1 - frame_mask / 255)
        else:
            fg_com = foreground

        video_writer.write(fg_com.astype(np.uint8))
        rval, frame = video.read()
        rval_mask, frame_mask = mask.read()

    video_writer.release()

运行测试

python 复制代码
video_compositing(
    'data/video.mp4',
    'data/mask.mp4',
    'data/results.mp4',
    'data/img.jpg',
    position_params=[0., 0.3],  # 垂直,水平
    size_rate=1.8
)
相关推荐
程序员小远6 分钟前
软件测试常见Bug清单
自动化测试·软件测试·python·功能测试·测试工具·测试用例·bug
小仙女的小稀罕1 小时前
听不清重要会议录音急疯?这款常见AI工具听脑AI精准转译
开发语言·人工智能·python
书到用时方恨少!1 小时前
Python random 模块使用指南:从入门到精通
开发语言·python
第一程序员1 小时前
Python 4.0正式发布:新特性与学习建议
python·github
IAUTOMOBILE2 小时前
用Python批量处理Excel和CSV文件
jvm·数据库·python
威联通安全存储2 小时前
破除“重前端、轻底层”的数字幻象:如何夯实工业数据的物理底座
前端·python
Amour恋空2 小时前
Java多线程
java·开发语言·python
小陈工2 小时前
2026年3月28日技术资讯洞察:5G-A边缘计算落地、低延迟AI推理革命与工业智造新范式
开发语言·人工智能·后端·python·5g·安全·边缘计算
智算菩萨3 小时前
【OpenGL】10 完整游戏开发实战:基于OpenGL的2D/3D游戏框架、物理引擎集成与AI辅助编程指南
人工智能·python·游戏·3d·矩阵·pygame·opengl
movigo7_dou3 小时前
双目立体匹配
数码相机·opencv·计算机视觉