RealBasicVSR高清处理视频

autodl做了镜像:高清RealBasicVSR
首先在剪映将视频剪好导出,最多是720像素的,不然后面超分的时候会爆显存。剪映视频也最好是双数帧数结尾的,不然超分的时候单数图片会报错->RuntimeError: non-empty 3D or 4D input tensor expected but got ndim: 4
首先使用脚本把视频分割成图片
python 复制代码
import cv2
import os

# 视频文件所在目录
video_directory = r'D:\hc\dongtaibizhi\test'
# 获取目录中所有的mp4文件
video_files = [f for f in os.listdir(video_directory) if f.endswith('.mp4')]

for video_file in video_files:
    video_path = os.path.join(video_directory, video_file)

    # 创建以视频名命名的文件夹来保存图片
    output_folder = os.path.join(video_directory, os.path.splitext(video_file)[0])
    os.makedirs(output_folder, exist_ok=True)

    # 打开视频文件
    cap = cv2.VideoCapture(video_path)

    # 获取视频的原始帧率
    original_fps = int(cap.get(cv2.CAP_PROP_FPS))

    # 计算每秒需要提取的帧数
    frames_per_second = 30

    # 计算跳帧间隔
    frame_skip = max(1, original_fps // frames_per_second)

    # 初始化帧计数器
    frame_count = 0

    while True:
        ret, frame = cap.read()
        if not ret:
            break

        if frame_count % frame_skip == 0:
        # 保存图片
            image_filename = os.path.join(output_folder, f'frame_{frame_count:04d}.jpg')
            cv2.imwrite(image_filename, frame)

        frame_count += 1

    # 释放视频对象
    cap.release()
    print(f'已成功保存 {video_file} 的图片到 {output_folder}')
比如说现在图片集都放在ss3720这个文件夹里,那么运行命令进行图片高清化
python 复制代码
python inference_realbasicvsr.py configs/realbasicvsr_x4.py checkpoints/RealBasicVSR_x4.pth data/ss3720 results/ss3720  --max_seq_len=2
超分后使用~/RealBasicVSR-master/results,下的脚本进行图片合成视频(要改脚本里的文件路径)
python 复制代码
python image2video.py
参考网址:https://blog.csdn.net/zhiweihongyan1/article/details/124645615
相关推荐
王哈哈^_^21 分钟前
【源码教程+数据集】农作物分类检测数据集 10712 张,农作物分类检测系统实战教程
人工智能·算法·yolo·目标检测·计算机视觉·毕业设计·数据集
Angelina_Jolie2 小时前
深度图转换为3D点云
数码相机·计算机视觉·3d
七牛云行业应用3 小时前
Grok Imagine Video 1.5 实战指南:图生视频 API 完整接入与参数调优
音视频
王哈哈^_^3 小时前
YOLO分类任务训练教程:从数据准备到模型部署全流程
人工智能·yolo·计算机视觉·分类·数据挖掘
二等饼干~za8986685 小时前
geo优化系统源码搭建保姆式搭建教程
java·开发语言·django·php·音视频
换个昵称都难5 小时前
webrtc 的audio process介绍(新版本webrtc)
音视频·webrtc
AI人工智能+5 小时前
基于深度学习与计算机视觉的表格识别技术:不仅能精准提取表格中的文字内容,更能深度解析复杂的表格结构,实现版面信息的完美还原
深度学习·计算机视觉·自然语言处理·ocr·表格识别
也非非也5 小时前
Agnes AI 全模态 API 免费实测报告:文生图 + 文生视频完整测试
人工智能·音视频
心前阳光5 小时前
Unity之使用火山引擎实现音频剪辑提问,流式语音回复
unity·音视频·火山引擎