Windows 环境下安装 OmniParser

需要把项目代码下载到本地:

克隆项目代码

复制代码
git clone https://github.com/microsoft/OmniParser.git
cd OmniParser

克隆特别慢,只有50KB/s

创建并激活环境

复制代码
conda create -n "omni" python==3.12
conda activate omni

安装依赖包

复制代码
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

确保你在权重文件夹里下载了V2权重

复制代码
# 段1:定义要下载的文件列表(替代bash的{}展开)
$files = @(
    "icon_detect/train_args.yaml",
    "icon_detect/model.pt",
    "icon_detect/model.yaml",
    "icon_caption/config.json",
    "icon_caption/generation_config.json",
    "icon_caption/model.safetensors"
)

# 段2:循环下载文件(替代bash的for循环)
foreach ($f in $files) {
    huggingface-cli download microsoft/OmniParser-v2.0 "$f" --local-dir weights
}

# 段3:重命名文件夹(替代bash的mv,-Force强制覆盖)
Move-Item -Path "weights/icon_caption" -Destination "weights/icon_caption_florence" -Force

然后运行

复制代码
python gradio_demo.py

遇到的错误

omni环境中运行gradio_demo.py时触发了ValueError: Unknown argument: show_log,核心原因是你安装的 PaddleOCR 版本较新,而 OmniParser 代码中使用了该版本已移除的show_log参数 ------ 新版本的 PaddleOCR 不再支持show_log这个初始化参数,传入后会被识别为未知参数从而报错。

你在omni环境中运行gradio_demo.py时又触发了ValueError: Unknown argument: use_gpu,核心原因是你安装的 PaddleOCR 3.x + 版本彻底重构了设备指定逻辑,移除了use_gpu参数,改用device参数来指定运行设备(CPU/GPU) ,代码中仍传入use_gpu会被识别为未知参数。

相关推荐
qq_3692243317 天前
Windows全系通用!ntdll.dll文件丢失、报错、闪退问题的完整排查与修复教程
windows·dll·dll修复·dll丢失·dll错误
阿米亚波18 天前
【Windows】QEMU 启动 openEuler aarch64/arm64 架构系统 + 离线软件源
linux·windows·经验分享·笔记·架构·arm
caimouse18 天前
Reactos 第 10 章 网络操作 — 10.3.1 NIC驱动
网络·windows
初圣魔门首席弟子18 天前
Node.js 详细介绍(知识库版)
windows·qt·node.js·知识库
CHENG-JustDoIt18 天前
AI工具 | 爆火开源项目Odysseus AI 工作台:从项目介绍、部署情况及其使用等多方位分析指南(含详细步骤)
大数据·人工智能·windows·python·ai·开源·github
kingbal18 天前
Windows:flutter环境搭建
windows·flutter
未若君雅裁18 天前
Python 数据容器详解,list、tuple、str、set、dict 到底怎么选
windows·python·list
CodeKwang18 天前
Windows 环境 OCCT 8.0 编译构建及与 Qt6 项目集成
windows·qt·opencascade
我是伪码农18 天前
小兔鲜1-25
linux·服务器·windows
vx-Biye_Design18 天前
springboot安阳地区研学旅游服务小程序-计算机毕业设计源码12785
java·vue.js·windows·spring boot·tomcat·maven·mybatis