YOLO四种常见的关键点数据集说明

姿势估计数据集概述

TXT 文件中每一行的数字按空格分隔,必须严格遵循以下序列逻辑:

[类别ID] [框中心X][框中心Y] [框宽度W] [框高度H] [点1_X] [点1_Y][点1_可见度] [点2_X] [点2_Y] [点2_可见度] ...

  • 第 1 项 类别ID:整数。例如 0 代表人,1 代表狗。
  • 第 2~5 项 边界框 (BBox) :物体的外接矩形框的归一化参数 ( c x , c y , w , h ) (cx, cy, w, h) (cx,cy,w,h)
  • 第 6 项及之后 关键点序列 (Keypoints) :按每 2 个或 3 个数字为一组循环。通常为 ( x , y , v ) (x, y, v) (x,y,v):
    • x, y:关键点的归一化坐标。
    • v (Visibility, 可见度) :通常为 0(未标注/在图外)、1(被遮挡但推测出位置)、2(清晰可见且已标注)。注:部分极简数据集可能没有 v 维度,只保留 x, y。

数据集 YAML 配置文件

除了存放图片和 txt 标签的文件夹,还必须有一个 data.yaml 文件来告诉模型如何读取这些数据。YOLO官网的数据集配置文件如下(关键点检测任务):

yaml 复制代码
# 数据集路径
path: ../datasets/my_pose_dataset
train: images/train
val: images/val

# 姿态估计必填字段
kpt_shape: [17, 3]  # [关键点总数, 每个关键点的维度]。3代表(x,y,v),2代表仅有(x,y)
flip_idx: [0, 2, 1, 4, 3, 6, 5, 8, 7, 10, 9, 12, 11, 14, 13, 16, 15]

# 类别设定
names:
  0: person

# Keypoint names per class
kpt_names:
  0:
    - nose
    - left_eye
    - right_eye
    - left_ear
    - right_ear
    - left_shoulder
    - right_shoulder
    - left_elbow
    - right_elbow
    - left_wrist
    - right_wrist
    - left_hip
    - right_hip
    - left_knee
    - right_knee
    - left_ankle
    - right_ankle

注意点如下:

Ultralytics 官方支持并内置了多种典型的拓扑结构,你也可以自定义任何点数的数据集:

  • COCO-Pose / COCO8-Pose :人体的标准姿态,17 个关键点。
  • Hand Keypoints :人手部骨架跟踪,21 个关键点。
  • Dog-Pose :针对狗的姿态分析,24 个关键点。
  • Tiger-Pose :针对老虎等野生动物,12 个关键点(且没有可见度维度,所以它的 shape 是 [12, 2])。

参考链接: https://docs.ultralytics.com/zh/datasets/pose/

1. Person 17 (COCO 数据集人体骨架)

目前计算机视觉中最通用的人体姿态估计标准,包含 17 个关键点,主要涵盖五官和四肢关节。

关键点序号 (Index) 部位名称 (中文) 部位名称 (英文) 说明
0 鼻子 Nose 面部中心基准点
1, 2 左眼, 右眼 L/R Eye 配合鼻子计算面部朝向
3, 4 左耳, 右耳 L/R Ear
5, 6 左肩, 右肩 L/R Shoulder 躯干上部宽度基准
7, 8 左肘, 右肘 L/R Elbow 手臂中段关节
9, 10 左手腕, 右手腕 L/R Wrist 手臂末端
11, 12 左胯/髋, 右胯/髋 L/R Hip 躯干下部/骨盆位置
13, 14 左膝盖, 右膝盖 L/R Knee 腿部中段关节
15, 16 左脚踝, 右脚踝 L/R Ankle 腿部末端

COCO姿态估计示意图:


2. Hand 21 (手部 21 点骨架)

通常基于 MediaPipe 或 COCO-WholeBody 的标准,精准描绘了手掌和五根手指的全部关节。

关键点序号 (Index) 部位名称 (中文) 部位名称 (英文) 说明
0 手腕 Wrist (Root) 整个手部拓扑图的根节点
1, 2, 3, 4 拇指关节 Thumb (CMC, MCP, IP, Tip) 从手掌根部到拇指指尖的4个点
5, 6, 7, 8 食指关节 Index Finger (MCP, PIP, DIP, Tip) 从指根关节到食指指尖的4个点
9, 10, 11, 12 中指关节 Middle Finger 同上,中指的4个点
13, 14, 15, 16 无名指关节 Ring Finger 同上,无名指的4个点
17, 18, 19, 20 小指关节 Pinky Finger 同上,小指的4个点

参考链接: https://docs.ultralytics.com/zh/datasets/pose/hand-keypoints/#introduction


3. Dog 18 (AP-10K 动物/狗骨架)

在学术界,标准的 AP-10K(泛哺乳动物姿态估计数据集)通常定义了 17个 关键点,也可能是 18 个关键点。通常第18个点增加的是"尾尖 Tail Tip")。

关键点序号 (Index) 部位名称 (中文) 部位名称 (英文) 说明
0, 1 左眼, 右眼 L/R Eye 动物面部特征
2 鼻子 Nose
3 脖颈/颈后 Neck / Withers 连接头部与躯干的基准
4 尾巴根部 Root of tail 脊椎的末端
5, 6, 7 左前肢 (肩, 肘, 爪) L_Shoulder, L_Elbow, L_Front_Paw 左前腿的三个关节
8, 9, 10 右前肢 (肩, 肘, 爪) R_Shoulder, R_Elbow, R_Front_Paw 右前腿的三个关节
11, 12, 13 左后肢 (髋, 膝, 爪) L_Hip, L_Knee, L_Back_Paw 左后腿的三个关节
14, 15, 16 右后肢 (髋, 膝, 爪) R_Hip, R_Knee, R_Back_Paw 右后腿的三个关节
17 尾巴尖 / 额外点 Tail Tip 尾巴

参考链接: https://github.com/AlexTheBad/AP-10K


4. Face 68 (iBUG 300W 人脸 68 关键点)

最经典的人脸对齐(Face Alignment)模型,点位密集地分布在五官边缘。

关键点区间 (Index) 部位名称 (中文) 部位名称 (英文) 包含的点数
0 ~ 16 下颌与脸颊轮廓 Jawline / Face Contour 17个点,从左耳根沿着下巴画到右耳根的U型弧线
17 ~ 21 左眉毛 Left Eyebrow 5个点,描绘左眉毛的上边缘走向
22 ~ 26 右眉毛 Right Eyebrow 5个点,描绘右眉毛的上边缘走向
27 ~ 35 鼻子 Nose 9个点,其中27-30为鼻梁,31-35为鼻翼底部的U形
36 ~ 41 左眼 Left Eye 6个点,顺时针描绘左眼的眼角和眼眶
42 ~ 47 右眼 Right Eye 6个点,顺时针描绘右眼的眼角和眼眶
48 ~ 59 嘴唇(外圈) Outer Lip 12个点,描绘嘴巴的外部轮廓边缘
60 ~ 67 嘴唇(内圈) Inner Lip 8个点,描绘嘴唇张开时的内部边缘(区分是否张嘴)
相关推荐
大鱼>12 天前
地平线BPU部署实战:YOLOv8在J5/X3上的算法适配与性能优化
算法·yolo·性能优化
stsdddd12 天前
YOLO系列目标检测数据集大全【第二十九期】
yolo·目标检测·目标跟踪
大鱼>12 天前
YOLO边缘部署深度指南:从YOLOv8n到NPU加速的全链路优化
yolo·aiot
AI棒棒牛12 天前
第 03 讲《监督学习:数据、标签、Loss与训练循环》
人工智能·学习·yolo·目标检测·yolo26
FL162386312912 天前
国内快递面单识别检测数据集VOC+YOLO格式422张6类别
人工智能·yolo·机器学习
stsdddd12 天前
YOLO系列目标检测数据集大全【第三十期】
yolo·目标检测·目标跟踪
YOLO数据集集合12 天前
无人机航拍地质灾害智能识别 山体滑坡实例分割数据集落地实战 | 泥石流监测 道路险情封堵 深度学习模型训练方案10296期
人工智能·深度学习·yolo·目标检测·无人机
音沐mu.12 天前
【73】墙壁建筑缺陷数据集(有v5/v8模型)/YOLO墙壁建筑缺陷检测
yolo·目标检测·目标检测数据集·墙壁建筑缺陷数据集·墙壁建筑缺陷检测
前网易架构师-高司机12 天前
带标注的辣椒病叶数据集,识别率95.9%,可识别三种病害和健康叶子,9916张图,支持yolo,coco json,voc xml,文末有模型训练代码
yolo·json·数据集·病害·叶病·病叶·辣椒
动物园猫12 天前
直升机停机坪目标检测数据集分享(适用于YOLO系列深度学习分类检测任务)
深度学习·yolo·目标检测