我的Dify OCR 识别发票准确率测试工具

RPA流程机器人项目上开始用Dify中的千问vl模型识别承兑票据,来帮助财务专员加快上账流程审批速度。在Dify中,我们有一个智能体,它只有很简单的一步,就是OCR识别,其实千问全量模型的识别率已经非常高了,但是为了做到100%的识别率和测试达成100%的识别率,我们需要不断优化这个智能体的提示词。这个过程是一个体力活,所以博主开发了批量测试工具来帮忙。

工具使用.net8 开发,所以执行文件有点大,带一个配置文件,文件中填入访问Dify的url和app ID.

批量调用工具的说明如下:

1、选择目录,选择后,该目录中的文件名称会加载到左边的列表。点击一个文件,准备OCR。

2、点击OCR识别按钮,一次发出10个识别请求给Dify,返回信息放在"结果"列表中。

3、程序在10个线程完成后,自动核对结果,如果错一个字,就会提示不同。

4、清空文本按钮可以手动清空每次返回的结果和核对结果列表。

有了这个工具,批量测试后,再去调整提示词,效率会高很多。

工具下载,中国移动云盘:

链接: https://yun.139.com/shareweb/#/w/i/2qidExRaKSirq

提取码:adoo

相关推荐
AI人工智能+7 小时前
专利证书识别技术;通过计算机视觉与深度学习,实现了专利文档从纸质到结构化数据的智能转换
深度学习·ocr·专利证书识别
hixiong1238 小时前
C# OpenvinoSharp部署DDDDOCR验证码识别模型
opencv·c#·ocr·openvino
阿里巴巴P8资深技术专家8 小时前
Spring Boot 实现文档智能解析与向量化:支持 Tika、MinerU、OCR 与 SSE 实时进度反馈
ai·ocr·ai大模型·rag·文档解析·mineru·tike
今天也不想动8 小时前
如何将NotebookLM PDF版PPT转为可编辑版本PPT
ocr·ppt·notebooklm
Chunyyyen9 小时前
【第三十周】OCR学习03
学习·ocr
Mr -老鬼1 天前
EasyclickOCR模块的正确用法
ocr·easyclick
钟良堂1 天前
Java开发OCR(自动识别图片中的文字)Tesseract-OCR + Tess4J 和 百度智能云OCR API
java·ocr·图片文字识别
qq_546937271 天前
PDF工具的天花板!PDF补丁丁:开源免费+无广告,支持Win7~Win11,批量OCR秒完成
pdf·ocr
E_ICEBLUE2 天前
零成本实现文档智能:本地化 OCR 提取与 AI 处理全流程实战
人工智能·ocr
AI人工智能+2 天前
智能表格识别技术:通过深度学习与版面分析相结合,解决传统OCR在复杂表格处理中的局限性
深度学习·ocr·表格识别