3D人体建模的前沿探索(二):深入解析SMPL-IK与多视角人体网格重建

文章目录


一、前言

在当今的计算机视觉和人体建模领域,随着虚拟现实、动画、游戏以及医疗等应用的快速发展,如何精确地捕捉和重建人体形状和姿态成为一个重要课题。本篇博客将深入探讨几种主流的人体建模方法,包括SMPL、SMPLX、STAR等。这些模型为生成逼真的人体动画和实现高效的人体姿态分析提供了强大的工具支持,从而推动了相关技术的前沿进展。通过对这些模型的比较与研究,我们可以更好地理解其背后的技术逻辑与应用潜力。

本博客是系列文章的第二篇,将继续深入探索人体建模的相关技术。通过详细介绍SMPL-IK模型的构建与应用,以及多视角3D人体网格重建的创新方法,我们将深入探讨这些技术如何为AI驱动的艺术创作和其他领域提供新的可能性。


二、使用步骤

1.引入库

SMPL-IK

SMPL-IK: Learned Morphology-Aware Inverse Kinematics for AI Driven Artistic Workflows

概述

本文介绍了一种名为SMPL-IK的机器学习逆向运动学(IK)求解器,该求解器适用于广泛的人类形态,并集成在实时3D软件中,为AI驱动的艺术工作流程提供了新的可能性。SMPL-IK基于SMPL模型,该模型是一个用于联合建模人体网格、骨架和姿态的原理性模型。文章还提出了SMPL-SI(SMPL形状反演机制),它能够将任意的人类骨架映射到SMPL空间,从而允许艺术家在自定义角色上应用SMPL-IK。通过结合SMPL-IK和SMPL-SI,作者展示了如何将从图像中获取的多个人3D场景应用到用户定义的角色上,并使用先进的机器学习IK工具进行编辑。

主要内容

  1. SMPL-IK的提出背景与意义

    • 逆向运动学(IK)问题:在机器人和动画领域中,IK是一个重要问题,传统上通常通过分析或迭代优化方法解决,如CCD或FABRIK算法。
    • 机器学习在IK中的应用:近年来,机器学习技术在IK中的应用受到了关注,尤其是基于神经网络的方法。
    • SMPL模型与IK的结合:SMPL是一个用于表示人体的模型,但现有的IK模型并未与SMPL模型集成,存在研究空白。
  2. SMPL-IK模型的构建与特点

    • SMPL-IK模型:作者提出了SMPL-IK,这是一个学习型的形态感知逆向运动学模块,它考虑了SMPL形状和性别信息,基于部分定义的姿态计算完整的姿态。
    • 模型优势:SMPL-IK支持任意数量和类型的效应器组合,能够操作SMPL模型中包含的广泛形态。
    • 数据集训练:SMPL-IK在大型AMASS数据集上进行训练,该数据集包含丰富的公共数据集。
  3. SMPL-SI的介绍与应用

    • SMPL-SI的作用:SMPL-SI通过学习从骨架特征到SMPLβ参数的映射,解决了逆向形状问题,能够将任意用户提供的骨架映射到SMPL近似表示。
    • SMPL-SI的训练方法:由于H36M数据集的限制,作者提出了新的训练策略,通过随机采样和高斯噪声增强来训练SMPL-SI模型。
    • 与自定义角色的整合:SMPL-SI允许艺术家将SMPL-IK应用于自定义角色,通过SMPL空间实现与现有AI算法的无缝接口。
  4. AI驱动的艺术工作流程

    • 从图像到3D场景的初始化:提出了一种处理单目RGB图像的方法,以初始化可编辑的3D场景。
    • 自定义角色的姿势编辑:结合SMPL-IK和SMPL-SI,可以将从图像中估计的姿态重定向到用户提供的3D角色上,并进行进一步编辑。
    • 效果器恢复与姿势编辑:SMPL-IK可以使用非常稀疏的约束进行姿势创作,通过效果器恢复机制,可以从图像中提取少量效果器来创建可编辑的初始姿势。

实验结果与局限性

  1. 实验结果

    • 在AMASS和H36M数据集上对SMPL-IK进行了基准测试,结果表明该模型在处理现实人类形状和姿态时效果较好。
  2. 局限性

    • SMPL-IK和SMPL-SI在处理非现实和比例失衡的人体类型时表现不佳,如某些卡通角色。

参考文献

文章列出了相关的参考文献,包括SMPL模型、逆向运动学技术、以及与SMPL-IK和SMPL-SI相关的研究工作。

结论

SMPL-IK和SMPL-SI的提出,为AI驱动的艺术工作流程带来了新的可能性,特别是在实时3D软件中,通过机器学习技术,使得艺术家能够更加灵活地创作和编辑3D角色的姿态和形态。尽管存在局限性,但该研究为未来在SMPL模型上集成更高级IK工具提供了重要的研究基础。


Multi-view 3D human mesh reconstruction

Learnable human mesh triangulation for 3D human pose and shape estimation

文献内容

  1. 研究背景

    • 多视图图像人体姿态估计:人体姿态估计是计算机视觉领域的一个长期存在的问题。在许多研究中,人体姿态被简单地表示为身体关节的3D坐标集合。然而,与关节坐标相比,人体关节旋转和形状估计没有受到太多关注。
    • SMPL模型:皮肤多个人线性模型(SMPL)常用于多视图人体网格重建方法,可以获取关节旋转和人体形状以及关节坐标。现有的方法中,与我们提出的最相似的方法是[42],该方法首先从多视图图像估计3D关节,然后通过拟合SMPL-X模型到3D关节来额外计算关节旋转和形状信息。
  2. 研究方法

    • LMT方法概述:提出了一种基于学习的人体网格三角化(LMT)方法,用于从稀疏多视图图像中重建基于SMPL的人体网格。该方法首先通过基于CNN的模型从输入图像估计网格顶点坐标,然后通过拟合SMPL模型到估计的顶点来获取SMPL参数。
    • 可见性模块:从每个单视图图像中估计子采样网格的每个顶点的可见性(vc∈RN),其中(N)表示子采样顶点的数量。
    • 特征聚合模块:将输入图像特征(F^{2D})从2D图像平面反投影到3D全局体素空间,生成(C)个体积未投影特征(vunproi∈R^{64×64×64×K}),然后聚合未投影特征以产生体积聚合特征(Va⁹9∈R^{64×64×64×K})。
    • 顶点回归模块:通过编码器-解码器结构生成子采样网格的顶点坐标(M),使用3D软argmax操作从3D热图中获取顶点坐标。
    • 拟合模块:用于获取顶点回归模块生成的顶点坐标(M)对应的SMPL参数。拟合模块基于优化,优化参数(\Theta)包含VPoser的潜在代码(z)、具有连续表示的全局旋转(R)、形状参数(β)和全局平移(t)。
  3. 实验设计

    • 实现细节:输入图像(I^c)和2D特征(F^{2D})的空间大小分别设置为( (H_0, W_0) = (384, 384) )和( (H, W) = (96, 96) )。使用数据集中提供的边界框从输入图像中裁剪出人体区域。除了拟合模块外,网络是端到端训练的。
    • 数据集:使用Human 3.6M和MPI-INF-3DHP数据集进行实验。Human 3.6M是一个大规模的3D人体姿态估计数据集,包括3.6M视频帧和从四个同步相机获取的3D身体关节注释。MPI-INF-3DHP是一个用于3D人体姿态估计的数据集,通过多相机无标记MoCap系统获得。
  4. 结果分析

    • 消融实验:通过消融实验验证了子顶点数量、热图分辨率和可见性对网格重建性能的影响。实验结果表明,使用子顶点而不是全顶点可以解决GPU内存使用过量的问题,并且使用每个顶点的可见性可以提高网格顶点估计性能。
    • Human 3.6M数据集比较:与现有的多视图人体网格重建方法相比,LMT在Human 3.6M数据集上显著优于其他方法。LMT方法在关节旋转和人体形状估计方面取得了更好的性能。
    • MPI-INF-3DHP数据集比较:在MPI-INF-3DHP数据集上,LMT与LT-fitting方法进行了比较。LMT在关节坐标估计性能上与LT-fitting相当,但在关节旋转和形状估计方面,LMT提供了更准确的结果。

总体结论

  • LMT方法的优势:本文提出了一种基于可见性的子顶点估计和表面拟合的两阶段方法,用于从多视图图像中重建单个人体网格。该方法解决了全顶点估计导致的GPU内存使用过量问题,并通过使用每个顶点的可见性提高了网格顶点估计性能。
  • 未来研究方向:表面拟合被证明有助于估计关节旋转和人体形状,与关节拟合相比具有优势。未来的工作将探索更高效的方法来获取可见性信息,以及在不同视角和野外输入图像的条件下改进重建性能。

文献信息

  • 标题: 用于3D人体姿态和形状估计的可学习人体网格三角化
  • 作者: Sungho Chun, Sungbum Park, Ju Yong Chang
  • 所属机构: Dept of ECE, Kwangwoon University, Korea; NCSOFT, Korea
  • 关键词: 3D人体姿态估计, 人体形状估计, 可学习三角化, SMPL模型, 多视图图像
  • DOI: arXiv:2208.11251v1
  • 文献链接 : https://arxiv.org/abs/2208.11251

SMPLicit

SMPLicit: Topology-aware Generative Model for Clothed People

文献内容

  1. 研究背景

    • SMPLicit模型介绍:SMPLicit是一种全新的生成模型,用于联合表示人体姿态、形状和服装几何形状。与现有基于学习的方法不同,SMPLicit能够以统一的方式表示不同服装拓扑结构,同时控制服装的大小或紧松度等属性。
    • 相关工作:讨论了生成服装模型和从图像中重建着装人体的相关工作,包括基于数据驱动的方法、使用物理模拟引擎学习服装模型、以及非参数表示方法等。
  2. 研究方法

    • SMPLicit核心公式:SMPLicit基于SMPL人体模型,通过一个隐式网络架构来预测服装变形。该模型能够根据人体几何形状预测服装变形,并控制服装风格和剪裁。
    • SMPLicit核心训练:训练过程包括学习服装剪裁图像编码器、每个训练示例的风格潜在参数以及解码器网络的参数。训练过程中使用损失函数来优化网络参数。
    • SMPLicit核心推理:通过在T型姿态的密集采样点评估网络并使用Marching Cubes算法提取距离场的等值面来生成3D服装网格。
    • 姿态依赖变形:SMPLicit核心能够将服装悬挂在T型姿态的SMPL模型上,但不预测姿态依赖变形。为了使SMPLicit适用于动画应用,训练了一个姿态依赖模型。
  3. 实验设计

    • 训练数据:使用多个公开数据集和增强数据来训练SMPLicit,包括BCNet数据集、3D服装模型以及USC-HairSalon数据集等。
    • 拟合SMPLicit到着装人体3D扫描:将SMPLicit应用于拟合着装人体的3D扫描,与TailorNet和CAPE等方法进行比较,展示了SMPLicit在拟合不同服装拓扑结构方面的性能。
  4. 结果分析

    • 生成属性:SMPLicit能够通过主成分分析(PCA)在潜在空间中发现直观的服装属性变化方向,如袖长,并识别具有有趣特征的服装原型。
    • 拟合SMPLicit到3D扫描:SMPLicit能够拟合3D扫描数据,并且使用单一模型即可表示不同服装拓扑结构,如连帽衫和无袖上衣。
    • 拟合SMPLicit到图像:SMPLicit能够拟合图像中的着装人体,并提供身体和服装的3D重建,尤其在多层服装或多人场景中表现出色。

总体结论

  • SMPLicit的优势:SMPLicit是一个能够表示不同服装拓扑结构的生成模型,通过少量可解释的参数控制服装风格和剪裁。该模型完全可微分,可以集成到更大的端到端可训练系统中。
  • 应用前景:实验表明,SMPLicit在拟合3D扫描和图像中着装人体的3D重建方面均超越了现有技术,为虚拟试衣等应用提供了新的可能性。

文献信息

  • 标题: SMPLicit:拓扑感知的着装人体生成模型
  • 作者: Enric Corona, Albert Pumarola, Guillem Alenyà, Gerard Pons-Moll, Francesc Moreno-Noguer
  • 所属机构: Institut de Robòtica i Informàtica Industrial, CSIC-UPC, Barcelona, Spain; University of Tübingen, Germany; Max Planck Institute for Informatics, Germany
  • 关键词: SMPLicit, 生成模型, 着装人体, 拓扑感知, 服装几何形状, 深度学习
  • DOI: 10.48550/arXiv.2103.06871
  • 文献链接 : http://www.iri.upc.edu/people/ecorona/smplicit/

SMPLpix

SMPLpix: Neural Avatars from 3D Human Models

文献内容

  1. 研究背景

    • 深度生成模型的进展:近年来,深度生成模型在合成人类图像的逼真度上取得了前所未有的成就。然而,这些模型在灵活控制生成过程方面仍存在局限性,例如在改变相机视角和人体姿态的同时保持主体身份不变。
    • 经典可变形人体模型:SMPL及其后续模型提供了对姿态和形状的全面控制,但依赖于传统的计算机图形学渲染流程。这些流程需要显式的网格光栅化,无法修复原始3D几何中的缺陷或缺乏逼真度,且直到最近才被完全整合进深度学习框架。
    • 研究动机:本研究旨在弥合经典基于几何的渲染与最新在像素空间操作的生成网络之间的差距,提出一种直接将稀疏3D网格顶点转换为逼真图像的网络,无需传统光栅化机制。
  2. 研究方法

    • 数据准备:使用商业3D扫描仪收集超过一千个扫描数据,通过SMPL模型注册到原始扫描数据,获得一组带有RGB颜色的3D顶点作为输入。
    • 神经渲染网络:训练一个UNet型神经网络,将初始点投影映射到最终输出图像。网络通过最小化感知和对抗损失来训练,以生成与真实图像匹配的渲染图像。
    • 稀疏点集神经渲染:通过将流行的图像到图像翻译框架适应于将稀疏3D点集转换为RGB图像的任务,将几何遮挡推理、光栅化和图像增强等多个步骤合并到一个神经网络模块中。
  3. 实验设计

    • 数据细节:使用1668个穿着休闲服装的主体的3D扫描数据,涵盖性别、体型、年龄、种族以及服装图案和风格的多样性。每个主体从扫描仪相机架上的137个相机位置中随机选择20张照片。
    • 定量实验:与经典渲染流程进行比较,包括神经网格渲染器。使用PSNR和LPIPS两种定量指标进行评估,同时提供定性结果以展示模型的逼真度。
  4. 结果分析

    • 定量比较:SMPLpix在PSNR和LPIPS指标上均优于其他渲染器,表明其在像素级和感知相似度上均能产生更高质量的图像。
    • 定性比较:SMPLpix能够修复几何和纹理上的缺陷,如不真实的发髻、平滑的衣服和不真实的耳朵形状。此外,SMPLpix还能学习到特定顶点位置和形状组合与这些缺陷之间的关联,并在一定程度上重建松散的头发、马尾或松散的衣物。
    • 新视角生成:SMPLpix能够很好地泛化到新的视角,生成从几乎任意方向观看的图像。
    • 姿态生成:由于SMPL模型能够生成输入,SMPLpix可以以生成的方式改变渲染效果,例如,可以将主体的姿态动画化。

总体结论

  • SMPLpix的优势:SMPLpix结合了可变形3D模型和神经渲染的优势,能够生成具有衣物的新型人体图像,并且具有视觉质量和数据驱动结果的优点。与任何其他神经渲染器不同,SMPLpix可以改变人的形状,并且无需为每个主体重新训练。
  • 改进空间:SMPLpix代表了可控人体神经渲染器的一步,但仍有改进空间,例如渲染高频纹理仍然是一个挑战。未来的工作将探索将渲染器与从图像中推断SMPL身体的系统集成,以实现从野外图像训练的端到端人体图像生成系统。

文献信息

  • 标题: SMPLpix: 从3D人体模型生成神经化身
  • 作者: Sergey Prokudin, Michael J. Black, Javier Romero
  • 所属机构: Max Planck Institute for Intelligent Systems Tübingen Germany, Amazon Tübingen Germany, Amazon Barcelona Spain
  • 关键词: SMPL, 神经渲染, 3D人体模型, 图像合成, 深度学习
  • DOI: arXiv:2008.06872v2 [cs.CV] 9 Nov 2020
  • 文献链接 : https://arxiv.org/abs/2008.06872v2

SoftSMPL

SoftSMPL: Data-driven Modeling of Nonlinear Soft-tissue Dynamics for Parametric Humans

文献内容

  1. 研究背景

    • 人体软组织动力学的重要性:人体软组织动力学对于制作令人信服的人类动画至关重要。现有的大多数能够生成高度动态软组织变形的方法基于物理方法,但这些方法由于人体内部复杂性和昂贵的模拟过程而难以实现。
    • 数据驱动模型的挑战:数据驱动模型有潜力直接从真实世界数据(例如,3D重建序列)学习人体软组织变形,但由于动态变形的高度非线性和数据集重建保真度的稀缺,这是一个非常具有挑战性的任务。
  2. 研究方法

    • SoftSMPL方法:提出了一种基于学习的方法来模拟具有高度表达性软组织动力学的参数化人体模型。SoftSMPL接受身体形状描述符和运动描述符作为输入,并产生动态软组织变形,这些变形可以推广到未见过的形状和运动。
    • 关键贡献 :本方法的核心有三个关键贡献:
      1. 一种新的运动描述符,它通过移除特定于主体的特征来解耦标准姿势表示;
      2. 一种基于神经网络的递归回归器,它能够推广到未见过的形状和运动;
      3. 一个高效的非线性变形子空间,能够表示任意形状的软组织变形。
  3. 实验设计

    • 数据集:使用Dyna数据集中的4D序列进行训练,该数据集包含5名女性受试者执行的52个动态序列的高细节变形。
    • 网络架构和训练:使用TensorFlow实现所有网络,包括编码器-解码器架构和R回归器。使用Adam优化器进行训练,自动微分功能用于解决方程。
  4. 结果分析

    • 软组织自编码器评估:通过定量评估,我们的非线性自编码器在各种子空间尺寸上重建软组织变形的准确性,与基于PCA的线性方法相比,我们的自编码器在所有测试的子空间尺寸上都表现得更好。
    • 软组织回归器评估:我们的方法在推广到新形状和运动方面显著优于现有方法。我们的回归器能够推广到未见过的形状和运动,这在补充视频中有详细展示。

总体结论

SoftSMPL结合了新颖的运动描述符和递归回归器,生成能够再现高度表达性软组织变形的每顶点3D位移。我们的方法通过提出新的解耦运动描述符和新颖的子空间及回归器,能够以前所未有的细节将软组织变形建模为身体形状和姿势的函数。

文献信息

  • 标题: SoftSMPL:参数化人体非线性软组织动力学的数据驱动建模
  • 作者: Igor Santesteban, Elena Garces, Miguel A.Otaduy, Dan Casas
  • 所属机构: Universidad Rey Juan Carlos, Madrid, Spain
  • 关键词: SoftSMPL, 数据驱动建模, 非线性软组织动力学, 参数化人体模型, 递归回归器, 变形子空间
  • DOI: arxiv:2004.00326v1 [cs.CV] 1 Apr 2020
  • 文献链接 : https://arxiv.org/abs/2004.00326v1

SMPLy

SMPLy Benchmarking 3D Human Pose Estimation in the Wild

文献内容

  1. 研究背景

    • 3D人体姿态估计的重要性:人体姿态估计是计算机视觉领域的一个重要问题,具有广泛的应用前景,如机器人、虚拟/增强现实或人机交互等。
    • 数据集的局限性:目前,3D人体姿态和形状估计主要在受控环境中进行评估,且通常只展示在野外环境中捕获的少数图像的定性结果。
    • SMPL模型的应用:许多方法依赖于SMPL这样的参数化人体模型来预测姿态和形状变形的参数。
  2. 研究方法

    • 视频中静态人体姿态的重建:本文提出了一种利用多视图几何约束来增强3D姿态估计的方法,结合了图像中的2D检测和从图像重建的3D点云。
    • 人体实例分割与跟踪:使用DensePose进行每帧的人体分割,提供身体部位分割和密集的UV坐标。
    • SfM和点云清理:使用COLMAP进行每段视频的结构从运动(SfM)重建,然后根据人体分割结果清理点云。
    • SMPL优化:通过优化方案将SMPL模型拟合到序列中的每个实例,同时考虑相机运动和DensePose重建误差。
  3. 实验设计

    • 数据集的构建:利用Mannequin Challenge数据集,通过静态人物和相机运动的特性,应用结构从运动技术准确拟合SMPL模型。
    • 数据集验证:通过捕获RGB-D序列并与重建结果进行比较,验证了重建流程的质量。
  4. 结果分析

    • 姿态估计方法的比较:本文比较了多种基于SMPL的姿态估计方法,包括HMR、NBF、SPIN、DCT、TexturePose、GraphCMR和VIBE等。
    • 评估指标:使用MPJPE(平均关节位置误差)和PCK(正确关键点比例)等指标评估3D姿态和2D投影的准确性。
    • 实验结果:VIBE在3D姿态估计方面表现最佳,HMR在2D重投影误差方面表现最佳。所有方法在面对遮挡或截断的人体时都容易失败。

总体结论

  • 新数据集的贡献:本文提出了一个新的在野外环境中捕获的图像数据集,并提供了准确的地面真实姿态,用于评估最新的3D人体姿态估计方法。
  • 方法的有效性:通过实验验证了所提出的方法能够有效地重建视频中静态人体的姿态。
  • 未来工作的方向:本文揭示了现有方法在面对遮挡和困难姿态时的不足,为未来提高鲁棒性的工作提供了重要参考。

文献信息

  • 标题: SMPLy Benchmarking 3D人体姿态估计在野外
  • 作者: Vincent Leroy, Philippe Weinzaepfel, Romain Brégier, Hadrien Combaluzier, Grégory Rogez
  • 所属机构: NAVER LABS Europe
  • 关键词: 3D人体姿态估计, SMPL模型, 数据集, 姿态重建, 姿态评估
  • DOI: arXiv:2012.02743v1 [cs.CV] 4 Dec 2020
  • 文献链接 : https://europe.naverlabs.com/research/computer-vision/mannequin-benchmark

DVGANs

Human Motion Modeling using DVGANs

研究背景

  1. 人类运动建模的重要性:

    人类运动建模在视觉和图形学领域非常重要,应用包括虚拟和物理世界的交互、机器人技术、动画制作和监控等。任务包括分类、检索、合成和完成等。

  2. 深度学习在人类运动建模中的应用:

    随着深度学习在视觉、语言和机器翻译领域的应用,学习丰富的表示成为可能。结合大规模人类运动数据集,如Human 3.6M,人类运动建模的性能得到了大幅提升。

  3. 生成对抗网络(GANs)在人类运动建模中的应用:

    GANs是一种生成框架,用于模拟隐式密度,如真实图像生成、完成、操纵和超分辨率。尽管GANs在图像领域取得了成功,但在人类运动建模中的应用却不多,这可能是由于其训练RNN生成器和判别器的复杂性。

研究方法

  1. DVGANs模型:

    提出了一种新的模型,即密集验证生成对抗网络(DVGANs),用于运动生成和完成。DVGANs结合了卷积和循环判别器和生成器。它将类别标签视为文本,这作为模型的良好正则化器。

  2. 生成器:

    • 使用两种类型的生成器。RNN生成器能够进行运动完成和生成,而CNN生成器能够进行运动生成。RNN生成器首先通过多层感知器(MLP)生成初始帧,然后使用LSTM-RNN生成帧差异。CNN生成器从低帧率动画开始,通过堆叠的残差反卷积操作逐步提高时间分辨率。
  3. 判别器:

    • GAN判别器与分类器非常不同。其任务是区分视频或图像是否来自真实或生成的分布。为了改进判别器,提出了密集验证和数据增强。

实验设计

  1. 数据集:

    使用Human 3.6M和CMU运动捕捉数据集进行评估。

  2. 评估指标:

    • 由于关注从头开始的运动生成,因此采用Inception Score来评估生成的多样性和真实性。此外,还使用动画检索准确率来评估生成的动画与动作描述的关联性。

结果分析

  1. 运动生成:

    • 在CMU Mocap数据集上,CNN-DVGAN能够生成8秒长的动画,显示出不同的变体。在H 3.6M数据集上,CNN-DVGAN能够生成5秒长的动画,所有15种动作都有丰富的训练数据,能够生成多样化和逼真的动作。
  2. 运动完成:

    • RNN-DVGAN能够完成具有逼真帧的序列。尽管RNN-DVGAN专注于超过2秒的长期生成,但其在短期运动完成方面仍然具有竞争力。
  3. 定量分析:

    • 通过消融研究,展示了在CMU Mocap和H 3.6M数据集上,模型架构(CNN、RNN)、密集验证、数据增强和最终剪辑的影响。结果显示,密集验证显著提高了RNNs和CNNs的结果。

总体结论

提出了一种新颖的DVGANs模型,用于基于文本条件的运动生成和完成。该模型使用密集验证、数据增强和最终剪辑。通过定性和定量评估,证明了DVGANs在运动生成和完成方面的能力。首次报告了Inception分数和动作检索准确率,并在CMU Mocap数据库上对运动生成进行了基准测试。

文献信息

  • 标题: 使用DVGANs的人类运动建模
  • 作者: Xiao Lin 和 Mohamed R. Amer
  • 所属机构: SRI International Princeton, NJ 08540, USA
  • 关键词: 人类运动建模、生成对抗网络、密集验证、运动生成、运动完成

三、总结

本博客深入探讨了几种主流的人体建模方法,包括SMPL等,以及它们在逆向运动学(IK)和多视角3D人体网格重建中的应用。通过对这些模型的构建、特点和应用进行分析,我们看到了它们在生成逼真的人体动画和实现高效人体姿态分析方面的强大支持能力。这些技术不仅推动了虚拟现实、动画和游戏领域的进步,也为医疗等其他应用提供了重要的基础。尽管在处理非现实的人体形状和比例失衡的角色方面仍存在一些局限,但通过不断的研究和创新,这些模型将继续优化和发展,为更多应用场景带来突破性的解决方案。

相关推荐
十年一梦实验室35 分钟前
【C++】sophus : rxso3.hpp 实现了 3D 空间中的旋转和缩放操作的 RxSO3 类 (二十一)
开发语言·c++·人工智能·算法·3d
逆旅行天涯3 小时前
【Threejs】从零开始(六)--GUI调试开发3D效果
前端·javascript·3d
mirrornan20 小时前
3D和AR技术在电商行业的应用有哪些?
3d·ar·3d建模·3d模型·三维建模
工业3D_大熊21 小时前
3D开发工具HOOPS助力造船业加速设计与数字化转型
3d
zaf赵21 小时前
3D 高斯溅射 (Gaussian Splatting)技术,一种实现超写实、高效渲染的突破性技术
3d
前端Hardy1 天前
HTML&CSS:酷炫的3D开关控件
前端·javascript·css·3d·html
Debroon2 天前
M3D: 基于多模态大模型的新型3D医学影像分析框架,将3D医学图像分析从“看图片“提升到“理解空间“的层次,支持检索、报告生成、问答、定位和分割等8类任务
3d
广东数字化转型2 天前
Three.js相机Camera控件知识梳理
3d·three.js
CASAIM2 天前
模具制造之三维扫描和逆向建模
目标检测·3d·汽车·制造
工业3D_大熊3 天前
HOOPS Communicator功能剖析:3D Web模型树交互的实用指南!
linux·windows·macos·3d·docker·c#·.net