视频横屏转竖屏播放-使用人脸识别+目标跟踪实现

视频横屏转竖屏播放

import cv2

import torch

from ultralytics import YOLO

from deep_sort_realtime.deepsort_tracker import DeepSort

from collections import defaultdict

初始化YOLOv8模型

model = YOLO('yolo11n.pt') # 你可以选择其他预训练模型,例如'yolov8s-face.pt'

初始化DeepSORT跟踪器

tracker = DeepSort(max_age=50, n_init=1, nn_budget=100)

打开视频文件

video_path = r'C:\Users\lenovo\Downloads\test.mp4'

video_path = r'不遗憾.mp4'

cap = cv2.VideoCapture(video_path)

获取视频的帧率和尺寸

fps = cap.get(cv2.CAP_PROP_FPS)

width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))

height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))

定义输出视频的参数

aspect_ratio = 9 / 16

output_width = int(height * aspect_ratio) # 竖屏宽度

output_height = height # 竖屏高度

fourcc = cv2.VideoWriter_fourcc(*'mp4v')

out = cv2.VideoWriter('output_video2.mp4', fourcc, fps, (output_width, output_height))

output_video 不遗憾竖屏

初始化上一帧的裁切区域

last_crop_x1, last_crop_y1, last_crop_x2, last_crop_y2 = 0, 0, output_width, output_height

维护一个计数器,记录每个跟踪ID的出现次数

track_id_counter = defaultdict(int)

most_common_track_id = 0

count=0

while cap.isOpened():

ret, frame = cap.read()

if not ret:

break

复制代码
# 检测人脸
results = model(frame)
detections = []

if results[0].boxes:
    for box, conf, cls in zip(results[0].boxes.xyxy, results[0].boxes.conf, results[0].boxes.cls):
        x1, y1, x2, y2 = box.cpu().numpy().astype(int)
        conf = conf.cpu().numpy().item()
        cls = cls.cpu().numpy().item()

detections.append(([x1, y1, x2 - x1, y2 - y1], conf, cls))

复制代码
        # 只保留类别为人脸的检测框
        if int(cls) == 0:  # 0 是人脸的类别ID
            detections.append(([x1, y1, x2 - x1, y2 - y1], conf, cls))
# 更新跟踪器
tracks = tracker.update_tracks(detections, frame=frame)

# 获取跟踪的目标
tracked_boxes = [(track.track_id, track.to_tlbr()) for track in tracks if track.is_confirmed()]

if tracked_boxes:
            # 更新每个跟踪ID的出现次数
    for track_id, _ in tracked_boxes:
        track_id_counter[track_id] += 1
    
# 检查当前的most_common_track_id是否存在于tracked_boxes
    if most_common_track_id is not None and most_common_track_id not in [track_id for track_id, _ in tracked_boxes]:
        print(f"Most common track ID {most_common_track_id} not found. Selecting new most common track ID.")

        # 从track_id_counter中选择一个仍然存在于tracked_boxes中且出现次数最多的track_id
        valid_track_ids = [track_id for track_id, _ in tracked_boxes]
        valid_track_id_counter = {k: v for k, v in track_id_counter.items() if k in valid_track_ids}
        if valid_track_id_counter:
            most_common_track_id = max(valid_track_id_counter, key=valid_track_id_counter.get)
        else:
            # 如果没有有效的track_id,选择当前帧中出现的第一个track_id
            most_common_track_id = tracked_boxes[0][0]

    # 选择出现次数最多的目标
    print("track_id: ", track_id, " most_common_track_id: ", most_common_track_id)

    for track_id, (x1, y1, x2, y2) in tracked_boxes:
        if track_id == most_common_track_id:
            # 计算人脸中心
            center_x = (x1 + x2) // 2
            center_y = (y1 + y2) // 2
            
            # 计算裁切区域
            crop_width = int(output_height * aspect_ratio)
            half_crop_width = crop_width // 2
            half_output_height = output_height // 2

            # 确保裁剪区域不会超出图像边界
            left = center_x - half_crop_width
            right =center_x + half_crop_width
            bottom = center_y - half_output_height
            top= center_y + half_output_height

            # 如果左边超出边界
            if left <=0:
                left = 0
                right=left+crop_width  # 将右边相应地向左移动
                

            # 如果右边超出边界
            if right >=width:
                right = width
                left = (right - crop_width)  # 将左边相应地向右移动
                

            # 如果顶部超出边界
            if bottom <=0:
                bottom = 0
                top = bottom+output_height  # 将底部相应地向上移动
                

            # 如果底部超出边界
            if top >= height:
                top = height
                bottom= (top - height)  # 将顶部相应地向下移动
                
            # 最终裁剪区域
            crop_x1, crop_y1 = left,bottom 
            crop_x2, crop_y2 = right, top
            

            # 平滑裁切区域的变化
            alpha = 1  # 平滑系数
            crop_x1 = int(alpha * crop_x1 + (1 - alpha) * last_crop_x1)
            crop_x2 = int(alpha * crop_x2 + (1 - alpha) * last_crop_x2)
            crop_y1 = int(alpha * crop_y1 + (1 - alpha) * last_crop_y1)
            crop_y2 = int(alpha * crop_y2 + (1 - alpha) * last_crop_y2)

            # 更新上一帧的裁切区域
            last_crop_x1, last_crop_y1, last_crop_x2, last_crop_y2 = crop_x1, crop_y1, crop_x2, crop_y2

            # 确保裁切区域在有效范围内
            if crop_y1 < crop_y2 and crop_x1 < crop_x2:
                # 裁切视频帧
                cropped_frame = frame[crop_y1:crop_y2, crop_x1:crop_x2]

                # 调整裁切区域的大小以匹配输出尺寸
                cropped_frame = cv2.resize(cropped_frame, (output_width, output_height))

                # 写入输出视频
                out.write(cropped_frame)
            else:
                # 如果裁切区域无效,使用居中裁切
                center_x = width // 2
                center_y = height // 2
                crop_width = int(output_height * aspect_ratio)
                crop_x1 = max(0, center_x - crop_width // 2)
                crop_x2 = min(width, center_x + crop_width // 2)
                crop_y1 = max(0, center_y - output_height // 2)
                crop_y2 = min(height, center_y + output_height // 2)

                # 居中裁切
                cropped_frame = frame[crop_y1:crop_y2, crop_x1:crop_x2]
                cropped_frame = cv2.resize(cropped_frame, (output_width, output_height))
                out.write(cropped_frame)
            break
else:
    # 如果没有检测到人脸,直接调整大小

resized_frame = cv2.resize(frame, (output_width, output_height))

out.write(resized_frame)

复制代码
    print("count: ",count)
    # 如果没有检测到人脸,使用上一次识别的窗口进行裁切
    if last_crop_x1 < last_crop_x2 and last_crop_y1 < last_crop_y2:
        cropped_frame = frame[last_crop_y1:last_crop_y2, last_crop_x1:last_crop_x2]
        cropped_frame = cv2.resize(cropped_frame, (output_width, output_height))
        out.write(cropped_frame)
    else:
        # 如果上一次的裁切区域无效,使用居中裁切
        center_x = width // 2
        center_y = height // 2
        crop_width = int(output_height * aspect_ratio)
        crop_x1 = max(0, center_x - crop_width // 2)
        crop_x2 = min(width, center_x + crop_width // 2)
        crop_y1 = max(0, center_y - output_height // 2)
        crop_y2 = min(height, center_y + output_height // 2)

        # 居中裁切
        cropped_frame = frame[crop_y1:crop_y2, crop_x1:crop_x2]
        cropped_frame = cv2.resize(cropped_frame, (output_width, output_height))
        out.write(cropped_frame)
count+=1
        # 释放资源

cap.release()

out.release()

欢迎使用Markdown编辑器

你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。

新的改变

我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下几点新功能,帮助你用它写博客:

  1. 全新的界面设计 ,将会带来全新的写作体验;
  2. 在创作中心设置你喜爱的代码高亮样式,Markdown 将代码片显示选择的高亮样式 进行展示;
  3. 增加了 图片拖拽 功能,你可以将本地的图片直接拖拽到编辑区域直接展示;
  4. 全新的 KaTeX数学公式 语法;
  5. 增加了支持甘特图的mermaid语法[1](#甘特图的mermaid语法1) 功能;
  6. 增加了 多屏幕编辑 Markdown文章功能;
  7. 增加了 焦点写作模式、预览模式、简洁写作模式、左右区域同步滚轮设置 等功能,功能按钮位于编辑区域与预览区域中间;
  8. 增加了 检查列表 功能。

功能快捷键

撤销:Ctrl/Command + Z

重做:Ctrl/Command + Y

加粗:Ctrl/Command + B

斜体:Ctrl/Command + I

标题:Ctrl/Command + Shift + H

无序列表:Ctrl/Command + Shift + U

有序列表:Ctrl/Command + Shift + O

检查列表:Ctrl/Command + Shift + C

插入代码:Ctrl/Command + Shift + K

插入链接:Ctrl/Command + Shift + L

插入图片:Ctrl/Command + Shift + G

查找:Ctrl/Command + F

替换:Ctrl/Command + G

合理的创建标题,有助于目录的生成

直接输入1次#,并按下space后,将生成1级标题。

输入2次#,并按下space后,将生成2级标题。

以此类推,我们支持6级标题。有助于使用TOC语法后生成一个完美的目录。

如何改变文本的样式

强调文本 强调文本

加粗文本 加粗文本

标记文本

删除文本

引用文本

H2O is是液体。

210 运算结果是 1024.

插入链接与图片

链接: link.

图片:

带尺寸的图片:

居中的图片:

居中并且带尺寸的图片:

当然,我们为了让用户更加便捷,我们增加了图片拖拽功能。

如何插入一段漂亮的代码片

博客设置页面,选择一款你喜欢的代码片高亮样式,下面展示同样高亮的 代码片.

javascript 复制代码
// An highlighted block
var foo = 'bar';

生成一个适合你的列表

  • 项目
    • 项目
      • 项目
  1. 项目1
  2. 项目2
  3. 项目3
  • 计划任务
  • 完成任务

创建一个表格

一个简单的表格是这么创建的:

项目 Value
电脑 $1600
手机 $12
导管 $1

设定内容居中、居左、居右

使用:---------:居中

使用:----------居左

使用----------:居右

第一列 第二列 第三列
第一列文本居中 第二列文本居右 第三列文本居左

SmartyPants

SmartyPants将ASCII标点字符转换为"智能"印刷标点HTML实体。例如:

TYPE ASCII
Single backticks 'Isn't this fun?' 'Isn't this fun?'
Quotes "Isn't this fun?" "Isn't this fun?"
Dashes -- is en-dash, --- is em-dash -- is en-dash, --- is em-dash

创建一个自定义列表

:
Text-to- conversion tool
:
John
:
Luke

如何创建一个注脚

一个具有注脚的文本。[2](#2)

注释也是必不可少的

Markdown将文本转换为 。

KaTeX数学公式

您可以使用渲染LaTeX数学表达式 KaTeX:

Gamma公式展示 Γ ( n ) = ( n − 1 ) ! ∀ n ∈ N \Gamma(n) = (n-1)!\quad\forall n\in\mathbb N Γ(n)=(n−1)!∀n∈N 是通过欧拉积分

Γ ( z ) = ∫ 0 ∞ t z − 1 e − t d t   . \Gamma(z) = \int_0^\infty t^{z-1}e^{-t}dt\,. Γ(z)=∫0∞tz−1e−tdt.

你可以找到更多关于的信息 LaTeX 数学表达式here.

新的甘特图功能,丰富你的文章

2014-01-07 2014-01-09 2014-01-11 2014-01-13 2014-01-15 2014-01-17 2014-01-19 2014-01-21 已完成 进行中 计划一 计划二 现有任务 Adding GANTT diagram functionality to mermaid

  • 关于 甘特图 语法,参考 这儿,

UML 图表

可以使用UML图表进行渲染。 Mermaid. 例如下面产生的一个序列图:
张三 李四 王五 你好!李四, 最近怎么样? 你最近怎么样,王五? 我很好,谢谢! 我很好,谢谢! 李四想了很长时间, 文字太长了 不适合放在一行. 打量着王五... 很好... 王五, 你怎么样? 张三 李四 王五

这将产生一个流程图。:
链接 长方形 圆 圆角长方形 菱形

  • 关于 Mermaid 语法,参考 这儿,

FLowchart流程图

我们依旧会支持flowchart的流程图:
Created with Raphaël 2.3.0 开始 我的操作 确认? 结束 yes no

  • 关于 Flowchart流程图 语法,参考 这儿.

导出与导入

导出

如果你想尝试使用此编辑器, 你可以在此篇文章任意编辑。当你完成了一篇文章的写作, 在上方工具栏找到 文章导出 ,生成一个.md文件或者.html文件进行本地保存。

导入

如果你想加载一篇你写过的.md文件,在上方工具栏可以选择导入功能进行对应扩展名的文件导入,

继续你的创作。


  1. mermaid语法说明 ↩︎

  2. 注脚的解释 ↩︎

*[HTML]: 超文本标记语言

相关推荐
科研小白_13 分钟前
2025年优化算法:人工旅鼠算法(Artificial lemming algorithm,ALA)
人工智能·算法·机器学习·数学建模·数据挖掘·回归
byxdaz19 分钟前
利用ffmpeg库实现音频Opus编解码
ffmpeg·音视频·opus
odoo中国23 分钟前
深度学习 Deep Learning 第5章 机器学习基础
人工智能·深度学习·机器学习
灏瀚星空24 分钟前
移动端医疗AI诊断系统的设计思路与技术展望——多模态生理数据分析的理论框架探讨
人工智能·经验分享·数据挖掘·数据分析
程序员海军29 分钟前
AI Agent爆火后,MCP协议为什么如此重要!
前端·人工智能·aigc
柒崽31 分钟前
小白学网站部署,手把手教你,Github Pages 如何自定义域名
前端·人工智能·cursor
安步当歌32 分钟前
【论文#目标检测】You Only Look Once: Unified, Real-Time Object Detection
图像处理·人工智能·目标检测·计算机视觉
科技百事34 分钟前
上海蒂正科技有限公司:技术驱动数字化,打造高端企业门户新标杆
人工智能·科技
静心问道35 分钟前
Grounding DINO: 将DINO与接地预训练结合用于开放集目标检测
人工智能·目标检测·计算机视觉
小诸葛IT课堂38 分钟前
模型部署实战:PyTorch生产化指南
人工智能·pytorch·python