Fine Structure-Aware Sampling(AAAI 2024)论文笔记和启发

文章目录

本文解决的问题

传统的基于Pifu的人体三维重建一般通过采样来进行学习。一般选择的采样方法是空间采样,具体是在surface的表面随机位移进行样本的生成。这里的采样是同时要在XYZ三个方向上进行。所以这导致了一个问题: 点的位移方向是没有任何约束的,也就是说在任意方向均可采样。可是者在一定的程度上就对确定surface产生了挑战。 因为我们采样的最终目的其实是为了确定目标平面,但是因为方向是随机的就很难准确的找到surface的具体位置,就出现了ambiguity。 就这个问题进行优化的方式比如DOS,限制了XY方向上的采样,只从Z方向上进行采样,标签由离相机方向最近的平面来决定的。这减小了一些模糊的情况,但是不够鲁棒。

本文提出的方法以及启发

FSS在DOS的基础上提出的新的改进,提出的是双样本点的方法,也就是说,在平面内和平面外分别确定两个点,这两个点之间的连线的中间点就必落在 surface在很大的程度上解决了模糊定位的情况,surface的位置就很清晰了。

除此之位的,本文还对较薄的身体位置进行了针对性的设计。对于相对较薄的身体部位而言,根据厚度去调整位移量,从而做到保留住像手指,耳朵,这样的细小的人体结构。并通过设计锚点样本,在这些较薄的区域内,设置一个锚点用于纠正bias。这里的BIAS主要是来自于标签的值,通常情况下,我们会认为大于0.5的值是在surface里面,小于0.5的值是在surface里面,等于0.5的值是surface上面,但是整体统计看来,最大的值也才0.6 所以模型会偏向于将点的值归类为在平面外面。

还有一点可以启发之后的工作,是用tri-pifu的模块代替了MLP 的解码工作。一般的方法都会通过marching cubes来提取网格,这个过程的计算成本特别高而且不可微。 这里改进的是将特征体积视为隐式函数的3D空间(D×H×W),通过Sigmoid激活直接输出0到1的占用值,无需MLP解码。这使得厚度可通过沿z轴求和特征体积来高效计算。

相关推荐
balmtv14 小时前
2026年多模态AI文件处理与联网搜索完全教程:国内镜像方案实测
人工智能
2501_9269783314 小时前
AI的三次起落发展分析,及未来预测----理论5.0的应用
人工智能·经验分享·笔记·ai写作·agi
前网易架构师-高司机14 小时前
带标注的瓶盖识别数据集,识别率99.5%,可识别瓶盖,支持yolo,coco json,pascal voc xml格式
人工智能·yolo·数据集·瓶盖
软件供应链安全指南14 小时前
以AI治理AI|问境AIST首家通过信通院大模型安全扫描产品能力评估!
人工智能·安全·ai安全·问境aist·aist·智能体安全
_爱明14 小时前
CUDA索引越界问题(Compile with `TORCH_USE_CUDA_DSA` to enable device-side assertions)
人工智能·深度学习
这张生成的图像能检测吗14 小时前
(论文速读)TCN:序列建模不一定需要 RNN
人工智能·深度学习·transformer·卷积·时序预测
大师影视解说15 小时前
基于Web端的AI电影解说自动化生产工具实测:4步完成从文案到成片的全流程
运维·人工智能·自动化·影视解说·电影解说工具·网页版电影解说·ai电影解说
是大强15 小时前
GaN器件
人工智能·神经网络·生成对抗网络
美狐美颜sdk15 小时前
从人脸关键点到动态贴图:面具特效在美颜SDK中的实现原理
前端·图像处理·人工智能·直播美颜sdk·美颜api
威联通网络存储15 小时前
告别掉帧与素材损毁:威联通 QuTS hero 如何重塑影视后期协同工作流
前端·网络·人工智能·python