Fine Structure-Aware Sampling(AAAI 2024)论文笔记和启发

文章目录

本文解决的问题

传统的基于Pifu的人体三维重建一般通过采样来进行学习。一般选择的采样方法是空间采样,具体是在surface的表面随机位移进行样本的生成。这里的采样是同时要在XYZ三个方向上进行。所以这导致了一个问题: 点的位移方向是没有任何约束的,也就是说在任意方向均可采样。可是者在一定的程度上就对确定surface产生了挑战。 因为我们采样的最终目的其实是为了确定目标平面,但是因为方向是随机的就很难准确的找到surface的具体位置,就出现了ambiguity。 就这个问题进行优化的方式比如DOS,限制了XY方向上的采样,只从Z方向上进行采样,标签由离相机方向最近的平面来决定的。这减小了一些模糊的情况,但是不够鲁棒。

本文提出的方法以及启发

FSS在DOS的基础上提出的新的改进,提出的是双样本点的方法,也就是说,在平面内和平面外分别确定两个点,这两个点之间的连线的中间点就必落在 surface在很大的程度上解决了模糊定位的情况,surface的位置就很清晰了。

除此之位的,本文还对较薄的身体位置进行了针对性的设计。对于相对较薄的身体部位而言,根据厚度去调整位移量,从而做到保留住像手指,耳朵,这样的细小的人体结构。并通过设计锚点样本,在这些较薄的区域内,设置一个锚点用于纠正bias。这里的BIAS主要是来自于标签的值,通常情况下,我们会认为大于0.5的值是在surface里面,小于0.5的值是在surface里面,等于0.5的值是surface上面,但是整体统计看来,最大的值也才0.6 所以模型会偏向于将点的值归类为在平面外面。

还有一点可以启发之后的工作,是用tri-pifu的模块代替了MLP 的解码工作。一般的方法都会通过marching cubes来提取网格,这个过程的计算成本特别高而且不可微。 这里改进的是将特征体积视为隐式函数的3D空间(D×H×W),通过Sigmoid激活直接输出0到1的占用值,无需MLP解码。这使得厚度可通过沿z轴求和特征体积来高效计算。

相关推荐
聚客AI几秒前
🌸万字解析:大规模语言模型(LLM)推理中的Prefill与Decode分离方案
人工智能·llm·掘金·日新计划
max5006002 分钟前
图像处理:实现多图点重叠效果
开发语言·图像处理·人工智能·python·深度学习·音视频
麦麦麦造16 分钟前
国外网友的3个步骤,实现用Prompt来写Prompt!超简单!
人工智能
闲看云起29 分钟前
从BERT到T5:为什么说T5是NLP的“大一统者”?
人工智能·语言模型·transformer
小麦矩阵系统永久免费1 小时前
小麦矩阵系统:让短视频分发实现抖音快手小红书全覆盖
大数据·人工智能·矩阵
新加坡内哥谈技术1 小时前
Chrome的“无处不在”与推动Web平台演进的使命
人工智能
kailp1 小时前
突破效率与质量边界:深入解析MiniMax-Remover视频物体移除方案
人工智能·ai·大模型·gpu算力·图片渲染
超人不会飛1 小时前
vue3 markdown组件|大模型应用专用
前端·vue.js·人工智能
虫无涯1 小时前
Doc2X为一切AI文档服务的基础设施,将PDF转换为Word、HTML、LaTeX、Markdown等
人工智能
倔强的石头1061 小时前
卷积神经网络(CNN):从图像识别原理到实战应用的深度解析
人工智能·神经网络·cnn