部署DeepSeek-OCR-2

1. 安装依赖

shell 复制代码
git clone https://github.com/deepseek-ai/DeepSeek-OCR-2.git
shell 复制代码
conda create -n deepseek-ocr2 python=3.12.9 -y
conda activate deepseek-ocr2
shell 复制代码
wget https://github.com/vllm-project/vllm/releases/download/v0.8.5/vllm-0.8.5+cu118-cp38-abi3-manylinux1_x86_64.whl

上面下面的whl,然后执行pip安装

shell 复制代码
pip install torch==2.6.0 torchvision==0.21.0 torchaudio==2.6.0 --index-url https://download.pytorch.org/whl/cu118
pip install vllm-0.8.5+cu118-cp38-abi3-manylinux1_x86_64.whl
pip install -r requirements.txt

执行下面命令安装会报错。

shell 复制代码
pip install flash-attn==2.7.3 --no-build-isolation

解决方法是下载这个依赖whl,然后执行pip安装。可以访问点击这里访问代码仓库选择适合的版本下载。

shell 复制代码
wget https://github.com/Dao-AILab/flash-attention/releases/download/v2.7.3/flash_attn-2.7.3+cu11torch2.6cxx11abiFALSE-cp312-cp312-linux_x86_64.whl

2. 修改配置文件

先去到下面的路径,然后修改config.py文件。

shell 复制代码
cd DeepSeek-OCR2-master/DeepSeek-OCR2-vllm
vim config.py

修改模型路径为自己下载到本地的模型路径,即修改MODEL_PATH

修改INPIUT_PATH和OUTPUT_PATH为自己想要输入的image或者pdf文件以及保存处理结果的路径。

3. 其它

更多内容欢迎,点击这里

对应的视频,点击这里跳转

不会部署的同学,可以有偿部署。

相关推荐
AC赳赳老秦8 小时前
OpenClaw二次开发入门:自定义技能,适配自身工作需求
服务器·数据库·python·mysql·django·deepseek·openclaw
stereohomology13 小时前
光荣梦想:大模型图片OCR中文识别对比 Qwen3.6plus强
ocr
Flying pigs~~15 小时前
主流大模型介绍(GPT、Llama、ChatGLM、Qwen、deepseek)
gpt·chatgpt·llm·llama·moe·deepseek·混合专家模式
凤山老林16 小时前
Java 开发者零成本上手:用 Spring AI Alibaba + Ollama 本地跑通 DeepSeek 大模型
java·人工智能·ollama·deepseek·spring ai 阿里巴巴
测试开发技术16 小时前
自动生成用例:基于OCR+ LLM的设计方案(附落地指南)
自动化测试·软件测试·自动化·llm·ocr·测试用例·用例自动生成
weixin_408099672 天前
OCR 在线识别 + API 接口实战:从网页验证到系统集成
图像处理·人工智能·后端·ocr·api·图片文字识别·文字识别
weixin_408099672 天前
身份证正反面合并+识别OCR接口调用
java·人工智能·后端·python·ocr·api·身份证ocr
li星野2 天前
DeepSeek提示词使用
人工智能·学习·deepseek
yuhulkjv3352 天前
豆包导出的Excel公式失效
人工智能·ai·chatgpt·excel·豆包·deepseek·ai导出鸭
AI人工智能+2 天前
施工许可证识别技术:深度融合计算机视觉(CV)与自然语言处理(NLP)
深度学习·计算机视觉·ocr·施工许可证识别