DreamCar运行笔记

文章标题:DreamCar: Leveraging Car-specific Prior for in-the-wild 3D Car Reconstruction

DreamCar,能够在给定少量图像甚至单张图像的情况下重建高质量的3D汽车。为了使生成模型更具泛化性,我们收集了一个名为Car360的汽车数据集,包含超过5600辆汽车。利用这个数据集,我们使生成模型对汽车更加鲁棒。我们使用特定于汽车的生成先验,通过分数蒸馏采样来引导重建。为了进一步补充监督信息,我们利用汽车的几何和外观对称性。

1. 环境配置

1.1. 下载代码

bash 复制代码
git clone https://github.com/xiaobiaodu/DreamCar.git

1.2. 创建环境

复制代码
conda create -n DreamCar python=3.9

1.3. 安装pytorch

bash 复制代码
sudo apt-get install libjpeg-dev libpng-dev
bash 复制代码
conda install pytorch==2.1.0 torchvision==0.16.0 torchaudio==2.1.0 pytorch-cuda=12.1 -c pytorch -c nvidia

1.4. 安装官方依赖

bash 复制代码
pip install -r requirememnts.txt

1.5. 安装其它依赖

bash 复制代码
pip install rembg envlight nvdiffrast mediapipe clip nerfacc
bash 复制代码
git clone https://github.com/NVlabs/tiny-cuda-nn.git

cd bindings/torch

pip install .
bash 复制代码
git clone https://github.com/NVlabs/nvdiffrast

cd nvdiffrast

pip install .

2. 下载预训练模型

2.1. Dreamcar123

2.2. Omnidata

3. 运行

3.1. 变量定义

bash 复制代码
export image_path="example_data/94b33ce331b844dcb991a2020742cebf"
export id=$(basename "$image_path")
export CUDA_VISIBLE_DEVICES=0

3.2. 预处理数据

bash 复制代码
python preprocess_image.py  "$image_path"

3.3. NeRF

bash 复制代码
python launch.py --train --config configs/dreamcar-coarse-nerf-nuscenes.yaml data.image_path="$image_path" data.random_camera.height=64 data.random_camera.width=64 data.height=64 data.width=64 system.guidance_3d.pretrained_model_name_or_path="load/zero123/dreamcar123.ckpt"   

4. 问题记录

4.1. timm文件下载失败

4.2. Hugging Face文件下载失败

参考文献

https://github.com/xiaobiaodu/DreamCar?tab=readme-ov-file

相关推荐
数据皮皮侠AI26 分钟前
上市公司耐心资本数据(2010-2025)
大数据·人工智能·笔记·能源·1024程序员节
元气少女小圆丶33 分钟前
SenseGlove Nova 2+Unity开发笔记2
笔记·unity·游戏引擎
bonechips1 小时前
深入理解 JavaScript的历史包袱——变量提升(Hoisting)
javascript·深度学习
春日见1 小时前
五分钟入门 强化学习---Q-Learning算法与实现
人工智能·python·深度学习·算法·机器学习·计算机视觉
多年小白2 小时前
【周末消息】2026年5月30日-6月1日
大数据·人工智能·深度学习·机器学习·金融
土狗TuGou2 小时前
SQL内功笔记 · 第2篇:列的约束
数据库·笔记·sql
Engineer邓祥浩2 小时前
宏观认知(3):AI战略与社会影响——吴恩达《AI for Everyone》Week3学习笔记
人工智能·笔记·学习
weixin_468466852 小时前
图像连通域分析新手实战指南
图像处理·人工智能·深度学习·ai·机器视觉·连通域
硅谷秋水3 小时前
世界动作模型:具身智能的下一前沿
大数据·人工智能·深度学习·计算机视觉·语言模型·机器人
啄缘之间3 小时前
8.【学习】工业级详细接口约束&覆盖率
开发语言·笔记·学习·uvm·sv