recognize-anything 识别万物

docker run --gpus all -itd --name=test -v /app:/app nvcr.io/nvidia/cuda:11.8.0-devel-ubuntu22.04

###########安装过程########################

更新包索引

apt update

安装 Python 3

apt install python3 -y

安装 pip

apt install python3-pip -y

安装 Git

apt install git -y

安装 ffmpeg 和一些图形相关的库

apt-get install ffmpeg libsm6 libxext6 -y

安装 OpenGL 库

apt-get install libgl1 -y

将 Python 3 的可执行文件复制到一个更通用的命令名

cp /usr/bin/python3 /usr/bin/python

安装 wget

apt-get install -y wget

克隆 "recognize-anything" 项目

git clone https://github.com/xinyu1205/recognize-anything.git

进入项目文件夹

cd recognize-anything/

安装一些 Python 包

pip install timm transformers fairscale pycocoevalcap

安装项目所需的所有依赖项

pip install -r requirements.txt

创建并进入一个名为 `pretrained` 的文件夹

mkdir pretrained

cd pretrained

使用 wget 下载预训练模型

wget https://huggingface.co/xinyu1205/recognize-anything-plus-model/resolve/main/ram_plus_swin_large_14m.pth

wget https://huggingface.co/xinyu1205/recognize-anything-plus-model/resolve/main/ram_plus_tag_embedding_class_4585_des_51.pth

wget https://huggingface.co/spaces/xinyu1205/Recognize_Anything-Tag2Text/resolve/main/ram_swin_large_14m.pth

wget https://huggingface.co/spaces/xinyu1205/Recognize_Anything-Tag2Text/resolve/main/tag2text_swin_14m.pth

#######################

启动脚本如下

python inference_ram_plus.py --image images/demo/demo1.jpg \

> --pretrained pretrained/ram_plus_swin_large_14m.pth

相关推荐
无心水6 小时前
【程序员AI入门:模型】19.开源模型工程化全攻略:从选型部署到高效集成,LangChain与One-API双剑合璧
人工智能·langchain·开源·ai入门·程序员ai开发入门·程序员的 ai 开发第一课·程序员ai入门
lxsy13 小时前
langchain 接入国内搜索api——百度AI搜索
langchain·百度ai搜索
明明跟你说过17 小时前
掌握 LangChain 文档处理核心:Document Loaders 与 Text Splitters 全解析
人工智能·语言模型·自然语言处理·langchain
ZhangJiQun&MXP2 天前
Top-p采样:解锁语言模型的创意之门
人工智能·深度学习·机器学习·语言模型·自然语言处理·langchain·概率论
珊珊而川2 天前
ChatPromptTemplate创建方式比较
服务器·langchain
fengchengwu20124 天前
langchain4j集成QWen、Redis聊天记忆持久化
redis·langchain·qwen·聊天记忆持久化
AI探子5 天前
【LangChain基础系列】深入全面掌握文本加载器
langchain
小饕7 天前
LangChain构建大模型应用之问答系统(五)
人工智能·python·langchain
yibuapi_com7 天前
Embedding 的数学特性与可视化解析
chatgpt·架构·langchain·embedding·claude·向量数据库·中转api
为啥全要学8 天前
vLLM部署Qwen2-7B模型推理
python·langchain·vllm