Windows 环境下安装 OmniParser

需要把项目代码下载到本地:

克隆项目代码

复制代码
git clone https://github.com/microsoft/OmniParser.git
cd OmniParser

克隆特别慢,只有50KB/s

创建并激活环境

复制代码
conda create -n "omni" python==3.12
conda activate omni

安装依赖包

复制代码
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

确保你在权重文件夹里下载了V2权重

复制代码
# 段1:定义要下载的文件列表(替代bash的{}展开)
$files = @(
    "icon_detect/train_args.yaml",
    "icon_detect/model.pt",
    "icon_detect/model.yaml",
    "icon_caption/config.json",
    "icon_caption/generation_config.json",
    "icon_caption/model.safetensors"
)

# 段2:循环下载文件(替代bash的for循环)
foreach ($f in $files) {
    huggingface-cli download microsoft/OmniParser-v2.0 "$f" --local-dir weights
}

# 段3:重命名文件夹(替代bash的mv,-Force强制覆盖)
Move-Item -Path "weights/icon_caption" -Destination "weights/icon_caption_florence" -Force

然后运行

复制代码
python gradio_demo.py

遇到的错误

omni环境中运行gradio_demo.py时触发了ValueError: Unknown argument: show_log,核心原因是你安装的 PaddleOCR 版本较新,而 OmniParser 代码中使用了该版本已移除的show_log参数 ------ 新版本的 PaddleOCR 不再支持show_log这个初始化参数,传入后会被识别为未知参数从而报错。

你在omni环境中运行gradio_demo.py时又触发了ValueError: Unknown argument: use_gpu,核心原因是你安装的 PaddleOCR 3.x + 版本彻底重构了设备指定逻辑,移除了use_gpu参数,改用device参数来指定运行设备(CPU/GPU) ,代码中仍传入use_gpu会被识别为未知参数。

相关推荐
程序员徐师兄8 小时前
Windows JDK11 下载安装教程,适合新手
java·windows·jdk11 下载安装·jdk11 下载教程
编码者卢布12 小时前
【App Service】Java应用上传文件功能部署在App Service Windows上报错 413 Payload Too Large
java·开发语言·windows
多来哈米14 小时前
openclaw在Windows部署
windows·openclaw
视觉AI14 小时前
【踩坑实录】Windows ICS 共享网络下,国产化盒子 SSH 连接异常的完整分析
网络·windows·ssh
qq_2466461917 小时前
openclaw快速安装-windows版
windows·stm32·单片机
sonrisa_18 小时前
Python同一类不同方法中变量值的传递
开发语言·windows·python
玖釉-18 小时前
探索连续细节层次(Continuous LOD):深入解析 NVIDIA 的 nv_cluster_lod_builder
c++·windows·图形渲染
MyY_DO18 小时前
第九课ida与花指令
windows·od
多多*20 小时前
Mysql数据库相关 事务 MVCC与锁的爱恨情仇 锁的层次架构 InnoDB锁分析
java·数据库·windows·sql·oracle·面试·哈希算法
LateFrames20 小时前
“蚯蚓涌动” 的屏保: DirectX 12 + ComputeSharp + Win32
windows·ui·gpu算力