【深度学习】Human3.6M索引和部位

c 复制代码
joint_name={
'Hips(髋部)': 0,
'RightUpLeg(右大腿)': 1,
'RightLeg(右小腿)': 2,
'RightFoot(右脚)': 3,
'LeftUpLeg(左大腿)': 4,
'LeftLeg(左小腿)': 5,
'LeftFoot(左脚)': 6,
'Spine(脊柱)': 7,
'Spine1(脊柱1)': 8,
'Neck(颈部)': 9,
'Neck1(颈部1)': 10,
'LeftArm(左臂)': 11,
'LeftForeArm(左前臂)': 12,
'LeftHand(左手)': 13,
'RightArm(右臂)': 14,
'RightForeArm(右前臂)': 15,
'RightHand(右手)': 16
}

coco to h36m:

c 复制代码
def h36m_coco_format(keypoints, scores):
    assert len(keypoints.shape) == 4 and len(scores.shape) == 3
 
    h36m_kpts = []
    h36m_scores = []
    valid_frames = []
 
    for i in range(keypoints.shape[0]):
        kpts = keypoints[i]
        score = scores[i]
 
        new_score = np.zeros_like(score, dtype=np.float32)
 
        if np.sum(kpts) != 0.:
            kpts, valid_frame = coco_h36m(kpts)
            h36m_kpts.append(kpts)
            valid_frames.append(valid_frame)
 
            new_score[:, h36m_coco_order] = score[:, coco_order]
            new_score[:, 0] = np.mean(score[:, [11, 12]], axis=1, dtype=np.float32)
            new_score[:, 8] = np.mean(score[:, [5, 6]], axis=1, dtype=np.float32)
            new_score[:, 7] = np.mean(new_score[:, [0, 8]], axis=1, dtype=np.float32)
            new_score[:, 10] = np.mean(score[:, [1, 2, 3, 4]], axis=1, dtype=np.float32)
 
            h36m_scores.append(new_score)
 
    h36m_kpts = np.asarray(h36m_kpts, dtype=np.float32)
    h36m_scores = np.asarray(h36m_scores, dtype=np.float32)
 
    return h36m_kpts, h36m_scores, valid_frames

可视化:

c 复制代码
import numpy as np
 
 
import cv2
import numpy as np
import json
 
 
kpt_color_map = {'h': {'id': 0, 'color': [255, 0, 0], 'radius': 3, 'thickness': -1}, 'tail': {'id': 1, 'color': [0, 255, 0], 'radius': 2, 'thickness': -1}}
 
# 点类别文字
kpt_labelstr = {'font_size': 1,  # 字体大小
    'font_thickness': 3,  # 字体粗细
    'offset_x': 20,  # X 方向,文字偏移距离,向右为正
    'offset_y': 10,  # Y 方向,文字偏移距离,向下为正
}
 
labelme_path = r'E:\data\new_path\635_5225_02-1\input\0000.json'
with open(labelme_path, 'r', encoding='utf-8') as f:
    labelme = json.load(f)
 
img_bgr=cv2.imread(r'E:\data\new_path\635_5225_02-1\input\0000.png')
 
for each_ann in labelme['shapes']:  # 遍历每一个标注
 
 
    kpt_label = each_ann['label']  # 该点的类别
 
    for point in each_ann['points']:
        kpt_xy = point
        kpt_x, kpt_y = int(kpt_xy[0]), int(kpt_xy[1])
 
        # 该点的可视化配置
        kpt_color = kpt_color_map[kpt_label]['color']  # 颜色
        kpt_radius = kpt_color_map[kpt_label]['radius']  # 半径
        kpt_thickness = kpt_color_map[kpt_label]['thickness']  # 线宽(-1代表填充)
 
        # 画圆:画该关键点
        img_bgr = cv2.circle(img_bgr, (kpt_x, kpt_y), kpt_radius, kpt_color, kpt_thickness)
 
        # 写该点类别文字:图片,文字字符串,文字左上角坐标,字体,字体大小,颜色,字体粗细
        img_bgr = cv2.putText(img_bgr, kpt_label, (kpt_x + kpt_labelstr['offset_x'], kpt_y + kpt_labelstr['offset_y']), cv2.FONT_HERSHEY_SIMPLEX, kpt_labelstr['font_size'], kpt_color, kpt_labelstr['font_thickness'])
 
cv2.imshow('img',img_bgr)
cv2.waitKey(0)
 

参考:https://github.com/gauraviiita/Visualization-of-Human3.6M-Dataset/

相关推荐
semantist@语校5 分钟前
如何为“地方升学导向型”语校建模?Prompt 框架下的宇都宫日建工科专门学校解析(7 / 500)
人工智能·百度·ai·语言模型·langchain·prompt·github
猫头虎9 分钟前
首个直播流扩散(LSD)AI模型:MirageLSD,它可以实时把任意视频流转换成你的自定义服装风格——虚拟换装新体验
人工智能·计算机视觉·音视频·实时音视频
美狐美颜SDK开放平台18 分钟前
2025年直播美颜SDK技术前瞻:AI驱动的美白滤镜功能革新
图像处理·人工智能·神经网络·美颜sdk·直播美颜sdk·视频美颜sdk
Lum110430 分钟前
AI驱动数据质量优化:破局数据治理难题
人工智能
SoFlu软件机器人30 分钟前
5 分钟用 AI 搭建 ERP 后台
人工智能
不会计算机的g_c__b36 分钟前
深入解析文本分类技术全景:从特征提取到深度学习架构
深度学习·分类·数据挖掘
呆头鹅AI工作室37 分钟前
[2025CVPR-目标检测方向] CorrBEV:多视图3D物体检测
人工智能·深度学习·神经网络·目标检测·计算机视觉·3d·卷积神经网络
泽安AI研习社44 分钟前
Cursor用户集体倒戈 !这14招让你榨干Claude Code【建议收藏】
人工智能·python
WoShop商城源码1 小时前
短视频矩阵系统哪家好?全面解析与推荐
大数据·人工智能·其他·矩阵
阿星AI工作室1 小时前
亚马逊AI编程软件Kiro:产品经理赶紧抱紧饭碗!
人工智能