配置RSUniVLM环境(自用)

首先git clone这个仓库,但是好像不太行,就直接下载下来吧

创个容器弄,容器里需要conda gpu

镜像的话 在dockerhub找到了一个:docker pull vkashyap10/llava-next

下载在了

|------------------------|----------|
| ssh root@10.12.107.240 | amos@123 |

这个机器上。等会看看怎么传到rd调研用的机器上。

复制代码
docker save -o llava-next.tar vkashyap10/llava-next
scp llava-next.tar root@bjrs-acg-tge0209f1a4.bjrs:/ssd2/lixiang/rs/dockerimage
docker load -i /ssd2/lixiang/rs/dockerimage/llava-next.tar

##ok scp用不了 那就用bos吧 上传和下载的命令示例如下
bcecmd bos cp text.txt bos:/mybucket/test.txt
bcecmd bos cp bos:/mybucket/test.txt text.txt

bcecmd bos cp llava-next.tar bos:/aipe-easyedge-model-zoo/tmp/llava-next.tar
bcecmd bos cp bos:/aipe-easyedge-model-zoo/tmp/llava-next.tar llava-next.tar

docker run --name rsunivlm \
    --net=host \
    --privileged \
    --cap-add=SYS_PTRACE --shm-size 5g \
    --gpus all \
    -v /ssd2/lixiang/rs:/ssd2/lixiang/rs \
    -itd \
    vkashyap10/llava-next:latest /bin/bash

docker exec -it rsunivlm bash

运行github上相应的命令去配环境,没碰到什么问题。

需要下checkpoints,在Google Drive上,要外网。。那就还是传到那个能连外网的机子上,再导过来。

复制代码
# 先安装gdown
pip install gdown

# 获取Google drive文件(不能是文件夹)的ID
# 比如这个https://drive.google.com/file/d/12LhpGHvGu4wIgXrONspNKqfGFpTfr0-p/view?usp=drive_link 里面的12LhpGHvGu4wIgXrONspNKqfGFpTfr0-p就是id。



# 在python中运行
>>> import gdown
>>> url = 'https://drive.google.com/uc?id=1Egva7JAYHliVUcqxk5pnFymyNaE3d_B3'
>>> output = 'added_tokens.json'
>>> gdown.download(url, output, quiet=False)

接下来是跑代码环节了。

在容器里装一个icoding的vscode。

复制代码
# 请复制以下命令到开发机上执行(注:如在容器内执行,请在命令后添加-p 8888参数,端口号需与启动容器端口相同)
curl -s http://baidu-ide.bj.bcebos.com/platform/script/host-script/install-agent.sh | bash -s -- -g a040a1ac-d5ad-4198-87ac-6a4353c8feaa -c 2c5c163e616de3b377e19c7bed5767ac -v 1.8.401.83.1.03

# 报错了,然后去宿主机上看,发现是8888端口被占用了。直接把命令改成-p 8889就成功了
相关推荐
IT古董14 小时前
【第五章:计算机视觉-项目实战之生成对抗网络实战】1.对抗生成网络原理-(1)对抗生成网络算法基础知识:基本思想、GAN的基本架构、应用场景、标注格式
人工智能·生成对抗网络·计算机视觉
浮生如梦_15 小时前
图片转视频
图像处理·人工智能·计算机视觉·音视频
春末的南方城市17 小时前
复旦&华为提出首个空间理解和生成统一框架UniUGG,支持参考图像和任意视图变换的 3D 场景生成和空间视觉问答 (VQA) 任务。
人工智能·科技·深度学习·计算机视觉·aigc
春末的南方城市21 小时前
上交提出单图生成3D场景方法SceneGen:单图输入,多资源输出,3D 合成性能飙升的“秘密武器”!
人工智能·计算机视觉
天涯路s21 小时前
OpenCV 基本模块
人工智能·opencv·计算机视觉
CV实验室1 天前
NeurIPS 2025 | 北大等提出C²Prompt:解耦类内与类间知识,攻克FCL遗忘难题!
人工智能·计算机视觉·prompt·论文·cv
不枯石1 天前
Matlab通过GUI实现点云的均值滤波(附最简版)
开发语言·图像处理·算法·计算机视觉·matlab·均值算法
不枯石1 天前
Matlab通过GUI实现点云的双边(Bilateral)滤波(附最简版)
开发语言·图像处理·算法·计算机视觉·matlab
千宇宙航2 天前
闲庭信步使用图像验证平台加速FPGA的开发:第三十课——车牌识别的FPGA实现(2)实现车牌定位
图像处理·计算机视觉·fpga开发·车牌识别
天涯路s2 天前
OpenCV 特征检测与描述
人工智能·opencv·计算机视觉