图生3d 图生全景 学习笔记

目录

instantsplat

Aluciddreamer

ZoeDepth

会自动下载模型:

图生全景图SD-T2I-360PanoImage:



instantsplat

Sparse-view SfM-free Gaussian Splatting in Seconds

稀疏视图无SfM高斯喷洒

GitHub - NVlabs/InstantSplat: InstantSplat: Sparse-view SfM-free Gaussian Splatting in Seconds

Aluciddreamer

GitHub - luciddreamer-cvlab/LucidDreamer: Official code for the paper "LucidDreamer: Domain-free Generation of 3D Gaussian Splatting Scenes".

解析器添加参数('--campath_gen','-cg'),类型为字符串,默认值为'rotate360',可选值为 ['lookdown','lookaround','rotate360'],帮助信息为 "用于场景生成的相机外参轨迹"。

解析器添加参数('--campath_render','-cr'),类型为字符串,默认值为'back_and_forth',可选值为 ['back_and_forth','llff','headbanging'],帮助信息为 "用于视频渲染的相机外参轨迹"。

ZoeDepth

引用地址:

GitHub - isl-org/ZoeDepth: Metric depth estimation from a single image

演示地址:

https://huggingface.co/spaces/shariqfarooq/ZoeDepth

模型下载地址:

Releases · isl-org/ZoeDepth · GitHub

会自动下载模型:

python 复制代码
self.d_model = torch.hub.load('./ZoeDepth', 'ZoeD_N', source='local', pretrained=True).to('cuda')

下载路径:

/mnt/pfs/models/torch/hub/intel-isl_MiDaS_master Using cache found in

/mnt/pfs/models/torch/hub/checkpoints

图生全景图SD-T2I-360PanoImage:

pip install numpy==1.23.2

python 复制代码
import sys
import os
os.chdir(os.path.dirname(os.path.abspath(__file__)))
 
import torch
 
current_dir = os.path.dirname(os.path.abspath(__file__))
 
paths = [os.path.abspath(__file__).split('scripts')[0]]
print('current_dir',current_dir)
paths.append(os.path.abspath(os.path.join(current_dir, 'src')))
 
for path in paths:
    sys.path.insert(0, path)
    os.environ['PYTHONPATH'] = (os.environ.get('PYTHONPATH', '') + ':' + path).strip(':')
    
import torch
from diffusers.utils import load_image
from img2panoimg import Image2360PanoramaImagePipeline

image = load_image("./data/i2p-image.jpg").resize((512, 512))
mask = load_image("./data/i2p-mask.jpg")

prompt = 'The office room'

# for <16GB gpu
input = {'prompt': prompt, 'image': image, 'mask': mask, 'upscale': False}

# for >16GB gpu (24GB at least)
# the similarity with the input image is poor because of the super-resolution steps. It should be improved.
# input = {'prompt': prompt, 'image': image, 'mask': mask, 'upscale': True}

model_id = 'models'
img2panoimg = Image2360PanoramaImagePipeline(model_id, torch_dtype=torch.float16)
output = img2panoimg(input)
output.save('result.png')
相关推荐
AndrewHZ1 小时前
【图像处理基石】如何入门色彩评估?
图像处理·人工智能·深度学习·色彩科学·hvs·色彩评估·颜色工程
静心问道2 小时前
TrOCR: 基于Transformer的光学字符识别方法,使用预训练模型
人工智能·深度学习·transformer·多模态
亲持红叶2 小时前
GLU 变种:ReGLU 、 GEGLU 、 SwiGLU
人工智能·深度学习·神经网络·激活函数
绝顶大聪明10 小时前
【深度学习】神经网络-part2
人工智能·深度学习·神经网络
Danceful_YJ11 小时前
16.使用ResNet网络进行Fashion-Mnist分类
人工智能·深度学习·神经网络·resnet
甄卷14 小时前
李沐动手学深度学习Pytorch-v2笔记【08线性回归+基础优化算法】2
pytorch·深度学习·算法
豆豆14 小时前
神经网络构建
人工智能·深度学习·神经网络
一勺汤16 小时前
多尺度频率辅助类 Mamba 线性注意力模块(MFM),融合频域和空域特征,提升多尺度、复杂场景下的目标检测能力
深度学习·yolo·yolov12·yolo12·yolo12改进·小目标·mamba like
霖0018 小时前
神经网络项目--基于FPGA的AI简易项目(1-9图片数字识别)
人工智能·pytorch·深度学习·神经网络·机器学习·fpga开发
神经星星19 小时前
英伟达实现原子级蛋白质设计突破,高精度生成多达800个残基的蛋白质
人工智能·深度学习·机器学习