百度飞浆OCR半自动标注软件OCRLabel配置【详细

今天帮标注人员写了一份完整的百度飞浆OCR标注软件的安装配置说明书、以供标注人员使用

包括各种环境安装包一起分享出来【conda\python\label项目包、清华源配置文件、pycharm社区版安装包】

提取码:umys

1、解压并安装tools文件下的miniconda,建议安装在D盘下的某个目录中,【C盘权限问题比较多后续会麻烦】

安装完成之后,检查 我的电脑-》属性-》高级系统变量-》path中是否有下框标红路径,没有的话需要加上【你自己的安装路径】,我的安装路径在D:\miniconda3,示例:

2、拿到tools文件夹下的.condarc 文件放在"C:\Users\XXX"下【XXX是你的本机用户名】,【我的用户名为29162】示例:

3、在最近安装找到anaconda prompt,【没找到可以在搜索框搜索】右键管理员身份打开。

①输入 conda create -n OCRTest python=3.8 【这个命令是创建了个环境,其中OCRTest是新取的环境名,这里取名以OCRTest为例】


输入"y"

显示到这里说明新环境创建成功

②把tools文件下的PaddleOCR-dygraph.zip解压,可以放到你自己的路径下,【我的路径是D:\BaiduNetdiskDownload\PaddleOCR-dygraph\PaddleOCR-dygraph,并以这个路径为例】

③在刚刚的Anaconda窗口中输入
conda activate OCRTest 【命令行前面的base变为OCRTest说明环境激活成功】

c 复制代码
d:
cd D:\BaiduNetdiskDownload\PaddleOCR-dygraph\PaddleOCR-dygraph\PPOCRLabel 

【注意,是进入到了PPOCRLabel路径下了】

④输入以下命令 【请直接按照截图中的步骤进行安装和运行,指令贴在下面了,方便粘贴使用】

c 复制代码
conda install paddlepaddle==2.6.1 --channel https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/Paddle/win-64   
python PPOCRLabel.py
pip install xlrd
python PPOCRLabel.py
pip install PyQt5

如果遇到Proceed ([y]/n)? 直接输入y

如果遇到paddle报错,请输入:

c 复制代码
conda install paddlepaddle==2.6.1 --channel https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/Paddle/win-64  

如果遇到cv2报错,请输入

c 复制代码
cd ..
pip install -r requirements.txt

如果报错OMP: Error #15: Initializing libiomp5md.dll请输入

cpp 复制代码
set KMP_DUPLICATE_LIB_OK=TRUE

详细步骤按照截图:





⑤至此,标注软件成功安装并打开啦!!!

解压xunlianji,并在标注软件界面选择 文件-》打开目录-》①选择你刚刚解压完的图片所在文件夹路径,②文件-》自动导出标记结果,界面如下,快捷键信息如下【常用快捷键w是新建标注框,d是切换下一张】。


手动缩小识别框,确保数字全部被识别框包裹。

自动标注会有一些错误,我们需要的仅仅是正确的号码牌数字

以下是几类错误,需要手动修改

1、多了英文符号的,需要在右侧红色框框里去掉英文符号

2、出现了汉字"品"需要删掉,选中汉字框,右键删除选择的区块

3、有号码牌残缺不全的,需要我们手动修改右侧的框内数字【左右号码牌通常相差为1,比如下面号码牌我知道左面是0186,那么即使右面号码牌的数字略有残缺,但我们可以猜出号码牌为0185】

4、标签框框过长的,手动拖动缩短;有多识别的,需要删掉多识别的内容,并拖动缩小标签框

修改后应该如下所示:

5、标签连在一起的,

修改后为:

相关推荐
paopao_wu7 小时前
DeepSeek-OCR实战(06):SpringBoot应用接入
java·spring boot·ai·ocr·deepseek
paopao_wu9 小时前
DeepSeek-OCR实战(05):DeepSeek-OCR-WebUI部署(Docker)
docker·ai·容器·ocr
OpenBayes10 小时前
教程上新丨Deepseek-OCR 以极少视觉 token 数在端到端模型中实现 SOTA
人工智能·深度学习·机器学习·ocr·大语言模型·文本处理·deepseek
kevin 110 小时前
财报OCR录入识别软件准确率高吗?易道博识财报录入实测效果如何?
ocr
❀͜͡傀儡师10 小时前
Docker 部署 DeepSeek-OCR 和WebUI
docker·容器·ocr
mit6.82410 小时前
[Column#187] 10data_struct | IP速查表 | 协议&TCP&UDP | DeepSeek-OCR
tcp/ip·udp·ocr
道可云1 天前
制造强国新图景实践——解析《实施意见》对制造业的影响
百度·制造
Ma0407131 天前
【论文阅读16】-LLM-TSFD:一种基于大型语言模型的工业时间序列人机回路故障诊断方法
百度
pursue.dreams1 天前
DeepSeek-OCR全面解析:技术原理、性能优势与实战指南
ocr·deepseek-ocr
啦啦9117141 天前
【工具】PixPin 电脑实用截图工具!带免费OCR截图/贴图/录屏/文字识别
ocr·贴图