DreamCar运行笔记

文章标题:DreamCar: Leveraging Car-specific Prior for in-the-wild 3D Car Reconstruction

DreamCar,能够在给定少量图像甚至单张图像的情况下重建高质量的3D汽车。为了使生成模型更具泛化性,我们收集了一个名为Car360的汽车数据集,包含超过5600辆汽车。利用这个数据集,我们使生成模型对汽车更加鲁棒。我们使用特定于汽车的生成先验,通过分数蒸馏采样来引导重建。为了进一步补充监督信息,我们利用汽车的几何和外观对称性。

1. 环境配置

1.1. 下载代码

bash 复制代码
git clone https://github.com/xiaobiaodu/DreamCar.git

1.2. 创建环境

复制代码
conda create -n DreamCar python=3.9

1.3. 安装pytorch

bash 复制代码
sudo apt-get install libjpeg-dev libpng-dev
bash 复制代码
conda install pytorch==2.1.0 torchvision==0.16.0 torchaudio==2.1.0 pytorch-cuda=12.1 -c pytorch -c nvidia

1.4. 安装官方依赖

bash 复制代码
pip install -r requirememnts.txt

1.5. 安装其它依赖

bash 复制代码
pip install rembg envlight nvdiffrast mediapipe clip nerfacc
bash 复制代码
git clone https://github.com/NVlabs/tiny-cuda-nn.git

cd bindings/torch

pip install .
bash 复制代码
git clone https://github.com/NVlabs/nvdiffrast

cd nvdiffrast

pip install .

2. 下载预训练模型

2.1. Dreamcar123

2.2. Omnidata

3. 运行

3.1. 变量定义

bash 复制代码
export image_path="example_data/94b33ce331b844dcb991a2020742cebf"
export id=$(basename "$image_path")
export CUDA_VISIBLE_DEVICES=0

3.2. 预处理数据

bash 复制代码
python preprocess_image.py  "$image_path"

3.3. NeRF

bash 复制代码
python launch.py --train --config configs/dreamcar-coarse-nerf-nuscenes.yaml data.image_path="$image_path" data.random_camera.height=64 data.random_camera.width=64 data.height=64 data.width=64 system.guidance_3d.pretrained_model_name_or_path="load/zero123/dreamcar123.ckpt"   

4. 问题记录

4.1. timm文件下载失败

4.2. Hugging Face文件下载失败

参考文献

https://github.com/xiaobiaodu/DreamCar?tab=readme-ov-file

相关推荐
缘友一世1 小时前
PyTorch可视化工具——使用Visdom进行深度学习可视化
人工智能·pytorch·深度学习
葡萄杨2 小时前
【软件使用】RSS(Really Simple Syndication)
笔记
东京老树根2 小时前
SAP学习笔记 - 开发13 - CAP 之 添加数据库支持(Sqlite)
笔记·学习
熊猫在哪3 小时前
野火鲁班猫(arrch64架构debian)从零实现用MobileFaceNet算法进行实时人脸识别(四)安装RKNN Toolkit2
人工智能·python·嵌入式硬件·深度学习·神经网络·目标检测·机器学习
老唐7774 小时前
PyTorch的基本操作
人工智能·pytorch·python·深度学习·神经网络·机器学习·计算机视觉
Panesle4 小时前
谷歌medgemma-27b-text-it医疗大模型论文速读:多语言大型语言模型医学问答基准测试MedExpQA
人工智能·深度学习·语言模型·自然语言处理·开源·大模型
攻城狮7号4 小时前
Strands Agents:AWS开源Agent框架的技术与应用全景
人工智能·深度学习·云计算·aws·智能体·strands agents
WSSWWWSSW4 小时前
解释:神经网络
人工智能·深度学习·神经网络
寻丶幽风4 小时前
论文阅读笔记——PixArt-α,PixArt-δ
论文阅读·笔记·文生图·扩散模型·t2i
九章云极AladdinEdu5 小时前
光子神经网络加速器编程范式研究:光子矩阵乘法的误差传播模型构建
开发语言·人工智能·深度学习·神经网络·矩阵·负载均衡·transformer