技术栈
文档解析
夏日白云
8 天前
图像处理
·
机器学习
·
pdf
·
llm
·
大语言模型
·
rag
·
文档解析
《PDF解析工程实录》第 12 章|别让模型贴着墙走:为什么加一圈空白,效果反而更好?
点此进入系列专栏先说结论:对于相当多的图像模型,在输入图像四周主动加一圈 Padding(空白边),往往能提升边界区域的识别效果。
夏日白云
9 天前
pdf
·
llm
·
大语言模型
·
rag
·
文档解析
《PDF解析工程实录》第 11 章|图像路线的工程现实:DPI、分辨率和内存炸裂
点此进入系列专栏如果你在 PDF 解析里走过图像路线,大概率都经历过某个时刻:一开始我也以为问题出在模型上。
夏日白云
10 天前
pdf
·
llm
·
大语言模型
·
rag
·
文档解析
《PDF解析工程实录》第 8 章|融合策略:不是兜底,而是信息利用率最大化
点此进入系列专栏如果前几章解决的是“用什么能力”“怎么组织能力”,那这一章要回答的,是一个更现实的问题:
夏日白云
11 天前
pdf
·
llm
·
大语言模型
·
多模态
·
rag
·
文档解析
《PDF解析工程实录》第 9 章|端到端多模态模型:不是接不住,而是要看业务能接受什么
点此进入系列专栏如果你一路写到了 pipeline、融合、阅读顺序,再回头看端到端多模态模型,视角其实会发生明显变化。
水中加点糖
14 天前
人工智能
·
二次开发
·
ai搜索
·
文档解析
·
ai知识库
·
ragflow
·
mineru
源码运行RagFlow并实现AI搜索(文搜文档、文搜图、视频理解)与自定义智能体(一)
众所周不知,RagFlow是由国内一家公司开源的一款软件,在AI知识库构建、智能体编排等场景中深受全球开发者的喜爱。 快速体验地址为:https://ragflow.io/
TextIn智能文档云平台
22 天前
人工智能
·
文档解析
LLM处理非结构化文档有哪些痛点
企业数字化转型进程中,80%以上的核心数据以PDF、Word、扫描件等非结构化形式存在。然而,大语言模型在处理这些文档时却频频"翻车"——表格识别错位、跨页内容断裂、手写字符无法辨认。这些技术瓶颈不仅拖累了知识库构建效率,更让企业的海量文档资产沦为"数字垃圾"。TextIn作为专业的文档解析工具,正通过技术创新将非结构化文档转化为LLM可高效利用的结构化数据,成为衔接文档与智能应用的关键桥梁。
TextIn智能文档云平台
1 个月前
人工智能
·
pdf
·
知识库
·
rag
·
coze
·
文档解析
从散乱资料到智能知识库:基于TextIn与Coze的RAG实战
构建企业专属知识库正逐渐成为高效信息管理的核心需求。然而,大多数企业面临一个普遍问题:信息载体高度碎片化——手写笔记、拍摄图像、会议PPT 、PDF等异构数据源散落各处。这些资料不仅难以系统化整理,更无法被有效复用,长期积累后甚至无法追溯存留内容。
商汤万象开发者
1 个月前
人工智能
·
多模态模型
·
ai应用
·
文档解析
·
版面分析
·
内容提取
UniParse:让多模态模型真正“读懂”文档的解析引擎
在多模态大模型迅速发展的今天,我们已经能让模型“看图说话”,甚至“读懂表格”,但要让模型真正理解复杂的文档结构(例如在PDF中准确识别章节、表格、公式与图像的逻辑关系)依然是一个未被彻底解决的问题。 UniParse正是为此而生:它是一款面向AI应用的通用文档解析工具,旨在将文档中的非结构化内容转化为结构化语义信息,使多模态模型能够高效、精准地理解和利用文档内容。
仙人掌_lz
2 个月前
人工智能
·
ocr
·
文档解析
Hybrid OCR-LLM框架用于在大量复杂密集企业级文档信息提取
在文档解析过程中,你是否遇到过表单、证书或报告之类的大量结构相似内容文档?今天的文章提供了一些想法和见解。
远上寒山
2 个月前
ocr
·
vllm
·
文档解析
·
deepseek
·
deepseek-ocr
·
视觉-文本压缩
DeepSeek-OCR 论文精读与实践:用“光学上下文压缩”把长文本变成图片,再由 VLM 高效还原
关键词:DeepSeek-OCR、视觉-文本压缩、长上下文、MoE、OCR、文档解析、vLLM、Transformers
余俊晖
3 个月前
人工智能
·
文档解析
如何构造一个文档解析的多模态大模型?MinerU2.5架构、数据、训练方法
前期,笔者在《文档智能》专栏中介绍了pipline式、两阶段式和端到端的多个文档解析相关方案及技术点。如:
摘星编程
5 个月前
智能文档处理
·
文档解析
·
多模态ai
·
图表分析
·
ocr技术
实战测试:多模态AI在文档解析、图表分析中的准确率对比
🌟 Hello,我是摘星! 🌈 在彩虹般绚烂的技术栈中,我是那个永不停歇的色彩收集者。 🦋 每一个优化都是我培育的花朵,每一个特性都是我放飞的蝴蝶。 🔬 每一次代码审查都是我的显微镜观察,每一次重构都是我的化学实验。 🎵 在编程的交响乐中,我既是指挥家也是演奏者。让我们一起,在技术的音乐厅里,奏响属于程序员的华美乐章。
sinat_33351887
7 个月前
文档解析
·
pdf处理技术
·
批量文档处理
轻量化开源方案——浅析PdfPatcher实际应用
批量处理能力支持修改文档属性/页码编号/页面链接一键清除复制/打印限制(实测WPS加密文档可解锁)自动清理隐藏冗余数据(经测试可平均缩减文件体积15%-30%)
合合技术团队
9 个月前
大数据
·
人工智能
·
算法
·
ocr
·
文档解析
TextIn ParseX文档解析参数使用指南(第一期)
TextIn ParseX通用文档解析作为一款适配多样化场景的PDF解析工具,在基础识别能力以上,还提供了便捷、完善的参数配置功能,便于用户根据自身需求调整,获得所需输出结果。在TextIn技术社群,我们的产品团队也经常接到关于参数调配的提问与建议,因此,在本期指南中,我们将介绍常用参数的作用及使用方法,前端界面中参数面板的位置如下图所示。
Nicolas893
1 年前
大模型
·
rag
·
检索增强生成
·
文档解析
·
ragflow
·
大模型垂直应用
【大模型实战篇】Mac本地部署RAGFlow的踩坑史
最近一篇文章还是在11月30日写的,好长时间没有打卡了。最近工作上的事情特别多,主要聚焦在大模型的预训练、微调和RAG两个方面。主要用到的框架是Megatron-DeepSpeed,后续会带来一些分享。今天的文章主要聚焦在RAG。
合合技术团队
1 年前
大数据
·
人工智能
·
自动化
·
文档解析
DocFlow票据AI自动化处理工具:出色的文档解析+抽取能力,提升企业文档数字化管理效能
目录财务应付金融信贷业务近期,DocFlow票据自动化产品正式上线。DocFlow是一款票据AI自动化处理工具,支持不同版式单据智能分类扩展,可选功能插件配置流程,满足多样业务场景。
合合技术团队
1 年前
科技
·
数据
·
文档解析
TextIn ParseX文档解析SDK工具新增Java版本
TextIn ParseX通用文档解析是一款大模型友好的解析工具,支持将pdf文档、jpg、img图像等文件快速转换为markdown格式,支持各类表格、公式解析,帮助大语言模型的数据清洗和文档问答任务。此前,为了让用户获得文档解析引擎返回的丰富版面元素,我们推出了一系列的sdk函数(+link),包括目录树、公式、表格、图片、全文markdown等结果的获取函数;同时开源了前端可视化组件(+link),满足用户个性化的校对使用需求。
b_qixin
1 年前
文档解析
·
合合信息ocr
合合信息文档解析Coze插件发布,PDF转Markdown功能便捷集成
近日,TextIn开发的PDF转Markdown插件正式上架Coze平台。在扣子搜索“pdf转markdown”,或在Coze平台搜索“pdf2markdown”,即可找到插件,在你的专属智能体中便捷使用文档解析功能。
我码玄黄
1 年前
java
·
apache
·
文档解析
·
tika
文件解析的终极工具:Apache Tika
Apache Tika 是一个开源的、跨平台的库,用于检测、提取和解析各种类型文件的元数据。它支持多种文件格式,包括文档、图片、音频和视频。