DreamCar运行笔记

文章标题:DreamCar: Leveraging Car-specific Prior for in-the-wild 3D Car Reconstruction

DreamCar,能够在给定少量图像甚至单张图像的情况下重建高质量的3D汽车。为了使生成模型更具泛化性,我们收集了一个名为Car360的汽车数据集,包含超过5600辆汽车。利用这个数据集,我们使生成模型对汽车更加鲁棒。我们使用特定于汽车的生成先验,通过分数蒸馏采样来引导重建。为了进一步补充监督信息,我们利用汽车的几何和外观对称性。

1. 环境配置

1.1. 下载代码

bash 复制代码
git clone https://github.com/xiaobiaodu/DreamCar.git

1.2. 创建环境

复制代码
conda create -n DreamCar python=3.9

1.3. 安装pytorch

bash 复制代码
sudo apt-get install libjpeg-dev libpng-dev
bash 复制代码
conda install pytorch==2.1.0 torchvision==0.16.0 torchaudio==2.1.0 pytorch-cuda=12.1 -c pytorch -c nvidia

1.4. 安装官方依赖

bash 复制代码
pip install -r requirememnts.txt

1.5. 安装其它依赖

bash 复制代码
pip install rembg envlight nvdiffrast mediapipe clip nerfacc
bash 复制代码
git clone https://github.com/NVlabs/tiny-cuda-nn.git

cd bindings/torch

pip install .
bash 复制代码
git clone https://github.com/NVlabs/nvdiffrast

cd nvdiffrast

pip install .

2. 下载预训练模型

2.1. Dreamcar123

2.2. Omnidata

3. 运行

3.1. 变量定义

bash 复制代码
export image_path="example_data/94b33ce331b844dcb991a2020742cebf"
export id=$(basename "$image_path")
export CUDA_VISIBLE_DEVICES=0

3.2. 预处理数据

bash 复制代码
python preprocess_image.py  "$image_path"

3.3. NeRF

bash 复制代码
python launch.py --train --config configs/dreamcar-coarse-nerf-nuscenes.yaml data.image_path="$image_path" data.random_camera.height=64 data.random_camera.width=64 data.height=64 data.width=64 system.guidance_3d.pretrained_model_name_or_path="load/zero123/dreamcar123.ckpt"   

4. 问题记录

4.1. timm文件下载失败

4.2. Hugging Face文件下载失败

参考文献

https://github.com/xiaobiaodu/DreamCar?tab=readme-ov-file

相关推荐
程序猿追4 天前
那个右下角的小数字怎么“卡”住我打字——我用 HarmonyOS 自己写了一个字数限制输入框
pytorch·华为·harmonyos
xiao5kou4chang6kai44 天前
MATLAB机器学习、深度学习--从数据预处理到模型训练
深度学习·机器学习·matlab·数据预处理
renhongxia14 天前
世界模型作为AGI落地底层底座的作用
人工智能·深度学习·生成对抗网络·自然语言处理·知识图谱·agi
计算机科研狗@OUC4 天前
(cvpr26) AIMDepth: Asymmetric Image-Event Mamba for Monocular Depth Estimation
人工智能·深度学习·计算机视觉
闪闪发亮的小星星4 天前
高斯光以及高斯光公式解释
笔记
闵孚龙4 天前
《PyTorch 深度修炼》Dataset 和 DataLoader:数据如何喂给模型
人工智能·pytorch·python
cqbzcsq4 天前
CellFlow虚拟细胞论文阅读
论文阅读·人工智能·笔记·学习·生物信息
阿米亚波4 天前
【Windows】QEMU 启动 openEuler aarch64/arm64 架构系统 + 离线软件源
linux·windows·经验分享·笔记·架构·arm
自传.4 天前
尚硅谷 Vibe Coding|第三章(1) Claude Code深度使用与进阶技巧 学习笔记
笔记·学习·尚硅谷·vibecoding
β添砖java4 天前
深度学习(22)网络中的网络NiN
人工智能·深度学习