Windows 环境下安装 OmniParser

需要把项目代码下载到本地:

克隆项目代码

复制代码
git clone https://github.com/microsoft/OmniParser.git
cd OmniParser

克隆特别慢,只有50KB/s

创建并激活环境

复制代码
conda create -n "omni" python==3.12
conda activate omni

安装依赖包

复制代码
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

确保你在权重文件夹里下载了V2权重

复制代码
# 段1:定义要下载的文件列表(替代bash的{}展开)
$files = @(
    "icon_detect/train_args.yaml",
    "icon_detect/model.pt",
    "icon_detect/model.yaml",
    "icon_caption/config.json",
    "icon_caption/generation_config.json",
    "icon_caption/model.safetensors"
)

# 段2:循环下载文件(替代bash的for循环)
foreach ($f in $files) {
    huggingface-cli download microsoft/OmniParser-v2.0 "$f" --local-dir weights
}

# 段3:重命名文件夹(替代bash的mv,-Force强制覆盖)
Move-Item -Path "weights/icon_caption" -Destination "weights/icon_caption_florence" -Force

然后运行

复制代码
python gradio_demo.py

遇到的错误

omni环境中运行gradio_demo.py时触发了ValueError: Unknown argument: show_log,核心原因是你安装的 PaddleOCR 版本较新,而 OmniParser 代码中使用了该版本已移除的show_log参数 ------ 新版本的 PaddleOCR 不再支持show_log这个初始化参数,传入后会被识别为未知参数从而报错。

你在omni环境中运行gradio_demo.py时又触发了ValueError: Unknown argument: use_gpu,核心原因是你安装的 PaddleOCR 3.x + 版本彻底重构了设备指定逻辑,移除了use_gpu参数,改用device参数来指定运行设备(CPU/GPU) ,代码中仍传入use_gpu会被识别为未知参数。

相关推荐
tokepson4 小时前
Mysql下载部署方法备份(Windows/Linux)
linux·服务器·windows·mysql
王老邪6 小时前
Windows下利用PowerShell实现Git自动推送
windows·git
洛豳枭薰12 小时前
List梳理
数据结构·windows·list
东木月13 小时前
使用python获取Windows产品标签
开发语言·windows·python
小范馆15 小时前
解决 Windows 11 安装时提示 “不支持 TPM 2.0” 和 “不支持安全启动” 的问题
windows·安全
还下着雨ZG15 小时前
【Window技能 01】每天自动关机:使用CMD脚本+任务计划程序实现每天定时关闭计算机
windows
洛水如云15 小时前
重塑数据管理逻辑!文件夹同步的实用指南(含工具选型 + 实操步骤)
windows·microsoft·电脑
石像鬼₧魂石16 小时前
windows系统139/tcp与445/tcp端口渗透完整流程闭环(复习总结)
windows·网络协议·tcp/ip
BD_Marathon17 小时前
MyBatis——封装SqlSessionUtils工具类并测试功能
java·windows·mybatis
洛水如云18 小时前
笔记本数据迁移新电脑:从备份到实操的高效指南(适用于台式机)
windows·microsoft·电脑