我的Dify OCR 识别发票准确率测试工具

RPA流程机器人项目上开始用Dify中的千问vl模型识别承兑票据,来帮助财务专员加快上账流程审批速度。在Dify中,我们有一个智能体,它只有很简单的一步,就是OCR识别,其实千问全量模型的识别率已经非常高了,但是为了做到100%的识别率和测试达成100%的识别率,我们需要不断优化这个智能体的提示词。这个过程是一个体力活,所以博主开发了批量测试工具来帮忙。

工具使用.net8 开发,所以执行文件有点大,带一个配置文件,文件中填入访问Dify的url和app ID.

批量调用工具的说明如下:

1、选择目录,选择后,该目录中的文件名称会加载到左边的列表。点击一个文件,准备OCR。

2、点击OCR识别按钮,一次发出10个识别请求给Dify,返回信息放在"结果"列表中。

3、程序在10个线程完成后,自动核对结果,如果错一个字,就会提示不同。

4、清空文本按钮可以手动清空每次返回的结果和核对结果列表。

有了这个工具,批量测试后,再去调整提示词,效率会高很多。

工具下载,中国移动云盘:

链接: https://yun.139.com/shareweb/#/w/i/2qidExRaKSirq

提取码:adoo

相关推荐
旗讯数字13 小时前
纸质手写表格二次录入效率低?旗讯 OCR 技术方案与行业落地实践
ocr
Olafur_zbj1 天前
【AI】使用OCR处理pdf
数据库·pdf·ocr
码二哥1 天前
借助豆包将vllm推理deepseek-ocr改成web服务访问
ocr·fastapi·vllm·豆包·deepseek-ocr
还是码字踏实1 天前
基于BM25的金融文档智能解析:基于OCR和紧凑型视觉语言模型的多阶段字段提取技术深度解读
金融·ocr·图像预处理·bm25页面预检索·紧凑型视觉语言模型vlm·多阶段金融文档解析框架
旗讯数字1 天前
旗讯 OCR 技术解析:金融行业手写表格识别方案与系统集成实践
大数据·金融·ocr
萧鼎1 天前
Python PyTesseract OCR :从基础到项目实战
开发语言·python·ocr
七十二计2 天前
高效视频抽帧与文字识别(OCR)技术体系详解
ocr·音视频
kevin 12 天前
财报处理自动化,财报OCR识别录入系统将非结构化报表转化为可分析数据
运维·自动化·ocr
AI人工智能+3 天前
文档抽取技术:通过OCR、NLP和机器学习技术,将非结构化的合同、发票等文档转化为结构化数据
人工智能·计算机视觉·nlp·ocr·文档抽取
ASKED_20193 天前
大模型 + 字形理解:Glyph-OCR 带来的 OCR 新范式
人工智能·深度学习·ocr