技术栈
关键信息提取
liuz_notes
1 年前
人工智能
·
python
·
ocr
·
文心一言
·
大语言模型
·
paddlepaddle
·
关键信息提取
【ChatOCR】OCR+LLM定制化关键信息抽取(附开源大语言模型汇总整理)
最近百度飞桨团队推出了一款基于文心大模型的通用图像关键信息抽取工具PP-ChatOCR。它结合了OCR文字识别和文心一言大语言模型,可以在多种场景下提取图像中的关键信息,效果非常惊艳。而传统的OCR识别技术的准确率容易受到多种因素影响,例如图像质量、字符布局、字体样式等。但当我们将OCR技术与大语言模型相结合时,可以避免繁杂的规则后处理,提升泛化能力,从而能够更智能、准确地理解和利用文本信息。(官方说明)
黯影行者
1 年前
人工智能
·
表格识别
·
paddleocr
·
关键信息提取
人工智能结合模板实现表格信息提取
本项目基于是OCR(文本识别)、表格识别的人工智能技术应用,通过表格识别,实现快速制作模板;模板单元格信息,结合OCR识别结果,将表格内容提取为结构化信息输出。与KIE(Key Information Extraction,关键信息抽取)模型对比,本项目准确率更高,效率更快,占用资源更小,能大大提升用户将非结构化的数据转化为结构化数据的质量。