第九周实验记录

1、安装Nerfstudio

环境配置

首先需要创建环境python=3.8,接着需要安装cuda11.7或11.3 这里安装cuda11.7

bash 复制代码
pip uninstall torch torchvision functorch
 
pip install torch==1.13.1 torchvision functorch --extra-index-url https://download.pytorch.org/whl/cu117

安装tinycudann

直接使用 pip install 命令很可能出错

所以先git 下文件在安装

bash 复制代码
 git clone --recursive https://github.com/nvlabs/tiny-cuda-nn
 cd tiny-cuda-nn
 cmake . -B build
 cmake --build build --config RelWithDebInfo -j

在执行最后一步的时候可能会出现缺少文件的错误,需要升级cmake版本 参考链接

接着链接pytorch

bash 复制代码
 cd tiny-cuda-nn/bindings/torch
 python setup.py install #时间较长

测试 输入python

python 复制代码
python
import tinycudann

如图 ,安装成功

安装nerfstudio

这里可以直接安装

bash 复制代码
 pip install nerfstudio

也可以git安装

bash 复制代码
 git clone https://github.com/nerfstudio-project/nerfstudio.git
 cd nerfstudio
 pip install --upgrade pip setuptools
 pip install -e .

运行实例

首先需要下载数据集,因为网络原因可能会无法下载,我是直接复制下载链接在浏览器下载。

bash 复制代码
 ns-download-data nerfstudio --capture-name=poster

将数据集解压后,可以直接进行训练

bash 复制代码
 ns-train nerfacto --data data/nerfstudio/poster

在HTTP框中 给出了viewer的地方,在pc端上使用ssh链接服务器 使用cmd输入

bash 复制代码
ssh -L 7007:localhost:7007 root@connect.beijinga.seetacloud.com -p 22048

复制链接打开浏览器,可以查看渲染情况

右侧可以渲染图像,得到视频,以及导出点云,在导出点云文件时命令可以运行,得到点云文件

2、MARS实验

按照github的命令配置环境,这里nerfstudio又安装了一些依赖

下载kitti数据集,一开始没有深度图,所以根据给的代码生成了深度图

开始训练(10月份版本的命令)

bash 复制代码
ns-train  nsg-kitti-car-depth-recon --data /root/autodl-tmp/mars/data/kitti-MOT/training/image_02/0006

如果想读取已经训练的权重 :--load_dir /root/autodl-tmp/mars/outputs/0006/nsg-kitti-car-depth-recon/2023-11-04_090030/nerfstudio_models

一开始训练出现killed的情况

可能是内存不足,服务器换了160g内存进行重新训练,可以运行

可视化模型为wandb

查看训练曲线以及渲染图像情况

3090显卡,0006序列训练10万次大概9-10个小时

可视化同样可以使用nerfstudio提供的界面 --vis viewer(但是界面很奇怪)可能存在问题

并且根据提供的命令,渲染视频,也出现了错误,可能是nerfstudio安装出现问题,后续继续解决

下周计划

学习nerfstudio 查看论文、文档

解决本周出现的问题

详细阅读mars论文

相关推荐
这张生成的图像能检测吗1 小时前
(论文速读)DSFormer:用于高光谱图像分类的双选择融合变压器网络
人工智能·深度学习·计算机视觉·transformer
my烂笔头4 小时前
目标检测个人知识库
人工智能·深度学习·计算机视觉
羊羊小栈5 小时前
基于「YOLO目标检测 + 多模态AI分析」的水果蔬菜病害智能检测分析预警系统
人工智能·yolo·目标检测·计算机视觉·毕业设计·大作业
深度学习lover6 小时前
<数据集>yolo 车牌识别<目标检测>
人工智能·python·yolo·目标检测·计算机视觉·车牌识别
Lsk_Smion7 小时前
让 CLIP 看懂病灶:TGC-Net 如何用三重校准打通医学图文分割
人工智能·深度学习·计算机视觉
星光技术人7 小时前
Enhancing End-to-End Autonomous Driving with Latent World Model
人工智能·深度学习·计算机视觉·自动驾驶·vln
code_pgf7 小时前
mllm指令微调的关键技术
人工智能·机器学习·计算机视觉
AI人工智能+7 小时前
银行卡识别技术通过深度学习与图像处理结合,实现复杂场景下银行卡信息的高效提取
深度学习·计算机视觉·ocr·银行卡识别
电子科技圈9 小时前
XMOS将亮相台北国际电脑展并演示其在边缘AI和创新音频与互联等领域内的新方案
人工智能·游戏·计算机视觉·视觉检测·音视频·语音识别·实时音视频