Windows 环境下安装 OmniParser

需要把项目代码下载到本地:

克隆项目代码

复制代码
git clone https://github.com/microsoft/OmniParser.git
cd OmniParser

克隆特别慢,只有50KB/s

创建并激活环境

复制代码
conda create -n "omni" python==3.12
conda activate omni

安装依赖包

复制代码
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

确保你在权重文件夹里下载了V2权重

复制代码
# 段1:定义要下载的文件列表(替代bash的{}展开)
$files = @(
    "icon_detect/train_args.yaml",
    "icon_detect/model.pt",
    "icon_detect/model.yaml",
    "icon_caption/config.json",
    "icon_caption/generation_config.json",
    "icon_caption/model.safetensors"
)

# 段2:循环下载文件(替代bash的for循环)
foreach ($f in $files) {
    huggingface-cli download microsoft/OmniParser-v2.0 "$f" --local-dir weights
}

# 段3:重命名文件夹(替代bash的mv,-Force强制覆盖)
Move-Item -Path "weights/icon_caption" -Destination "weights/icon_caption_florence" -Force

然后运行

复制代码
python gradio_demo.py

遇到的错误

omni环境中运行gradio_demo.py时触发了ValueError: Unknown argument: show_log,核心原因是你安装的 PaddleOCR 版本较新,而 OmniParser 代码中使用了该版本已移除的show_log参数 ------ 新版本的 PaddleOCR 不再支持show_log这个初始化参数,传入后会被识别为未知参数从而报错。

你在omni环境中运行gradio_demo.py时又触发了ValueError: Unknown argument: use_gpu,核心原因是你安装的 PaddleOCR 3.x + 版本彻底重构了设备指定逻辑,移除了use_gpu参数,改用device参数来指定运行设备(CPU/GPU) ,代码中仍传入use_gpu会被识别为未知参数。

相关推荐
handsomestWei8 分钟前
claude-code在win环境安装使用
windows·ai编程·claude·安装配置·cc-switch
秦时明月之君临天下36 分钟前
Windows如何删除任务管理器中的某个服务?
windows
麦田里的守望者_zhg1 小时前
Windows 执行 wsl --update 报错 1603:注册表权限导致 WSL 安装损坏问题排查与修复
windows
❆VE❆3 小时前
Claude Code 安装与配置完整指南(Windows)
windows·claude code
航Hang*3 小时前
VMware vSphere 云平台运维与管理基础——第5章:VMware vSphere 5.5 高级特性
运维·服务器·开发语言·windows·学习·虚拟化
Mapleay3 小时前
Ubuntu 源的重要性!之 libgmp-dev 无法安装
linux·服务器·windows
humors2214 小时前
微软工具包下载网址
windows·microsoft·微软·office·工具包·sysintervals
寺中人4 小时前
硬盘提示初始化的损坏,手动恢复MBR及EBR分区教程
windows·工具·硬盘修复
冷色系里的一抹暖调4 小时前
OpenClaw Docker 部署避坑指南:服务启动成功但网页打不开?
人工智能·windows·docker·ai·容器·opencode
开开心心就好5 小时前
能把网页藏在Word里的实用摸鱼工具
linux·运维·服务器·windows·随机森林·逻辑回归·excel