人体坐姿检测系统项目教程（YOLO11+PyTorch+可视化）

💡**本文主要内容：**本项目基于YOLO11深度学习目标检测算法，设计并实现了一个人体坐姿检测系统。系统能够自动识别图像或视频中的多种坐姿类型（如：正常坐姿、不良坐姿等），为健康监测、智能教室、办公环境管理等场景提供技术支持。

1.数据集介绍

数据集

本项目数据集包含多种场景下的人体坐姿图片，涵盖了正常坐姿、驼背、侧身、翘腿等多种常见坐姿。所有图片均经过人工标注，标注内容包括不同坐姿类别

细节图示例

2.基于YOLOv11的人体坐姿检测

修改sitting_pose_data.yaml

html 复制代码

train: ../train/images
val: ../valid/images
test: ../test/images
nc: 2
names: ['sitting_bad', 'sitting_good']

启动训练

python 复制代码

import torch
from ultralytics import YOLO
from pathlib import Path
def main():
    """快速训练主函数"""
    print("🧍‍♂️ 人体坐姿检测 - 快速GPU训练 (本地模型)")
    print("=" * 60)
    
    # 检查GPU
    if torch.cuda.is_available():
        device_name = torch.cuda.get_device_name(0)
        print(f"✅ 使用GPU: {device_name}")
        device = 'cuda'
    else:
        print("❌ GPU不可用，使用CPU")
        device = 'cpu'

3.训练结果分析

混淆矩阵

本图为混淆矩阵，用于展示模型在各个坐姿类别上的预测准确性。横轴为真实类别，纵轴为模型预测类别。每个格子的数值表示对应真实类别被预测为某类别的样本数量。对角线上的数值表示被正确分类的样本数，越大越好。非对角线上的数值表示分类错误的样本数，数值越小越好。颜色越深表示数量越多，颜色越浅表示数量越少。从图中可以看出，绝大多数样本被正确分类，说明模型对"sitting_bad"，"sitting_good"，"background"三类的区分能力较强。混淆矩阵有助于分析模型在哪些类别上容易混淆，为后续优化数据集或模型提供参考。

F1分数-置信度曲线

本图为F1-Confidence曲线，展示了模型在不同置信度阈值下的F1分数变化情况。曲线中分别绘制了"sitting_bad"、"sitting_good"两个类别的F1分数，以及整体平均F1分数。横轴为置信度阈值，纵轴为F1分数。可以看到，随着置信度阈值的提升，F1分数先升高后降低，说明模型在中等置信度时表现最佳。图例中标注了"all classes 0.91 at 0.530"，表示当置信度阈值为0.53时，整体F1分数达到最高0.91。曲线整体较为平滑且高位，说明模型对不同坐姿类别均有较好的检测性能，且对阈值不敏感，鲁棒性较好。

精度-置信度曲线

本图为Precision-Confidence曲线，展示了模型在不同置信度阈值下的精确率变化情况。曲线分别绘制了 "sitting_bad"、 "sitting_good"两个类别的精确率，以及整体平均精确率。横轴为置信度阈值，纵轴为精确率。精确率越高，说明模型预测为正样本时正确的比例越高。图例中标注了"all classes 1.00 at 0.918"，表示当置信度阈值为0.918时，整体精确率达到最高1.00。曲线整体呈上升趋势，说明随着置信度阈值的提高，模型的预测更加"保守"，但正确率也随之提升。

精度-召回率曲线

本图为Precision-Recall曲线，展示了模型在不同召回率下的精确率表现。曲线分别绘制了"sitting_bad"、"sitting_good"两个类别的PR曲线，以及整体平均PR曲线。横轴为召回率，纵轴为精确率，曲线越靠近右上角，说明模型性能越好。图例中标注了各类别的mAP@0.5值，以及整体mAP@0.5=0.955。曲线大部分区域保持在高位，说明模型在不同阈值下都能保持较高的精确率和召回率。曲线下的面积（mAP值）反映了模型在不同召回率下的平均精度表现，是衡量检测模型性能的重要指标。

召回率-置信度曲线

本图为Recall-Confidence曲线，展示了模型在不同置信度阈值下的召回率变化情况。曲线分别绘制了 "sitting_bad"、"sitting_good"两个类别的召回率，以及整体平均召回率。横轴为置信度阈值，纵轴为召回率。召回率越高，说明模型能够检测出更多的真实目标。图例中标注了"all classes 1.00 at 0.000"，表示当置信度阈值为0时，整体召回率达到最高1.00。曲线整体呈下降趋势，说明随着置信度阈值的提高，模型变得更加"严格"，但漏检的概率也随之增加。

4.Flask Web界面与系统设计

4.1Flask简介

Flask 是一个用 Python 编写的轻量级 Web 应用框架，具有简单易用、扩展性强等特点。它非常适合快速开发和部署基于 Web 的人工智能应用。通过 Flask，可以将深度学习模型与前端界面无缝集成，实现模型的在线推理和结果可视化

4.2安装Flask

python 复制代码

pip install flask

4.3系统功能与运行方式

复制代码

python app.py

图片检测实例：