文档解析

夏日白云8 天前
图像处理·机器学习·pdf·llm·大语言模型·rag·文档解析
《PDF解析工程实录》第 12 章|别让模型贴着墙走:为什么加一圈空白,效果反而更好?点此进入系列专栏先说结论:对于相当多的图像模型,在输入图像四周主动加一圈 Padding(空白边),往往能提升边界区域的识别效果。
夏日白云9 天前
pdf·llm·大语言模型·rag·文档解析
《PDF解析工程实录》第 11 章|图像路线的工程现实:DPI、分辨率和内存炸裂点此进入系列专栏如果你在 PDF 解析里走过图像路线,大概率都经历过某个时刻:一开始我也以为问题出在模型上。
夏日白云10 天前
pdf·llm·大语言模型·rag·文档解析
《PDF解析工程实录》第 8 章|融合策略:不是兜底,而是信息利用率最大化点此进入系列专栏如果前几章解决的是“用什么能力”“怎么组织能力”,那这一章要回答的,是一个更现实的问题:
夏日白云11 天前
pdf·llm·大语言模型·多模态·rag·文档解析
《PDF解析工程实录》第 9 章|端到端多模态模型:不是接不住,而是要看业务能接受什么点此进入系列专栏如果你一路写到了 pipeline、融合、阅读顺序,再回头看端到端多模态模型,视角其实会发生明显变化。
水中加点糖14 天前
人工智能·二次开发·ai搜索·文档解析·ai知识库·ragflow·mineru
源码运行RagFlow并实现AI搜索(文搜文档、文搜图、视频理解)与自定义智能体(一)众所周不知,RagFlow是由国内一家公司开源的一款软件,在AI知识库构建、智能体编排等场景中深受全球开发者的喜爱。 快速体验地址为:https://ragflow.io/
TextIn智能文档云平台22 天前
人工智能·文档解析
LLM处理非结构化文档有哪些痛点企业数字化转型进程中,80%以上的核心数据以PDF、Word、扫描件等非结构化形式存在。然而,大语言模型在处理这些文档时却频频"翻车"——表格识别错位、跨页内容断裂、手写字符无法辨认。这些技术瓶颈不仅拖累了知识库构建效率,更让企业的海量文档资产沦为"数字垃圾"。TextIn作为专业的文档解析工具,正通过技术创新将非结构化文档转化为LLM可高效利用的结构化数据,成为衔接文档与智能应用的关键桥梁。
TextIn智能文档云平台1 个月前
人工智能·pdf·知识库·rag·coze·文档解析
从散乱资料到智能知识库:基于TextIn与Coze的RAG实战构建企业专属知识库正逐渐成为高效信息管理的核心需求。然而,大多数企业面临一个普遍问题:信息载体高度碎片化——手写笔记、拍摄图像、会议PPT 、PDF等异构数据源散落各处。这些资料不仅难以系统化整理,更无法被有效复用,长期积累后甚至无法追溯存留内容。
商汤万象开发者1 个月前
人工智能·多模态模型·ai应用·文档解析·版面分析·内容提取
UniParse:让多模态模型真正“读懂”文档的解析引擎在多模态大模型迅速发展的今天,我们已经能让模型“看图说话”,甚至“读懂表格”,但要让模型真正理解复杂的文档结构(例如在PDF中准确识别章节、表格、公式与图像的逻辑关系)依然是一个未被彻底解决的问题。 UniParse正是为此而生:它是一款面向AI应用的通用文档解析工具,旨在将文档中的非结构化内容转化为结构化语义信息,使多模态模型能够高效、精准地理解和利用文档内容。
仙人掌_lz2 个月前
人工智能·ocr·文档解析
Hybrid OCR-LLM框架用于在大量复杂密集企业级文档信息提取在文档解析过程中,你是否遇到过表单、证书或报告之类的大量结构相似内容文档?今天的文章提供了一些想法和见解。
远上寒山2 个月前
ocr·vllm·文档解析·deepseek·deepseek-ocr·视觉-文本压缩
DeepSeek-OCR 论文精读与实践:用“光学上下文压缩”把长文本变成图片,再由 VLM 高效还原关键词:DeepSeek-OCR、视觉-文本压缩、长上下文、MoE、OCR、文档解析、vLLM、Transformers
余俊晖3 个月前
人工智能·文档解析
如何构造一个文档解析的多模态大模型?MinerU2.5架构、数据、训练方法前期,笔者在《文档智能》专栏中介绍了pipline式、两阶段式和端到端的多个文档解析相关方案及技术点。如:
摘星编程5 个月前
智能文档处理·文档解析·多模态ai·图表分析·ocr技术
实战测试:多模态AI在文档解析、图表分析中的准确率对比🌟 Hello,我是摘星! 🌈 在彩虹般绚烂的技术栈中,我是那个永不停歇的色彩收集者。 🦋 每一个优化都是我培育的花朵,每一个特性都是我放飞的蝴蝶。 🔬 每一次代码审查都是我的显微镜观察,每一次重构都是我的化学实验。 🎵 在编程的交响乐中,我既是指挥家也是演奏者。让我们一起,在技术的音乐厅里,奏响属于程序员的华美乐章。
sinat_333518877 个月前
文档解析·pdf处理技术·批量文档处理
轻量化开源方案——浅析PdfPatcher实际应用批量处理能力支持修改文档属性/页码编号/页面链接一键清除复制/打印限制(实测WPS加密文档可解锁)自动清理隐藏冗余数据(经测试可平均缩减文件体积15%-30%)
合合技术团队9 个月前
大数据·人工智能·算法·ocr·文档解析
TextIn ParseX文档解析参数使用指南(第一期)TextIn ParseX通用文档解析作为一款适配多样化场景的PDF解析工具,在基础识别能力以上,还提供了便捷、完善的参数配置功能,便于用户根据自身需求调整,获得所需输出结果。在TextIn技术社群,我们的产品团队也经常接到关于参数调配的提问与建议,因此,在本期指南中,我们将介绍常用参数的作用及使用方法,前端界面中参数面板的位置如下图所示。
Nicolas8931 年前
大模型·rag·检索增强生成·文档解析·ragflow·大模型垂直应用
【大模型实战篇】Mac本地部署RAGFlow的踩坑史最近一篇文章还是在11月30日写的,好长时间没有打卡了。最近工作上的事情特别多,主要聚焦在大模型的预训练、微调和RAG两个方面。主要用到的框架是Megatron-DeepSpeed,后续会带来一些分享。今天的文章主要聚焦在RAG。
合合技术团队1 年前
大数据·人工智能·自动化·文档解析
DocFlow票据AI自动化处理工具:出色的文档解析+抽取能力,提升企业文档数字化管理效能目录财务应付金融信贷业务近期,DocFlow票据自动化产品正式上线。DocFlow是一款票据AI自动化处理工具,支持不同版式单据智能分类扩展,可选功能插件配置流程,满足多样业务场景。
合合技术团队1 年前
科技·数据·文档解析
TextIn ParseX文档解析SDK工具新增Java版本TextIn ParseX通用文档解析是一款大模型友好的解析工具,支持将pdf文档、jpg、img图像等文件快速转换为markdown格式,支持各类表格、公式解析,帮助大语言模型的数据清洗和文档问答任务。此前,为了让用户获得文档解析引擎返回的丰富版面元素,我们推出了一系列的sdk函数(+link),包括目录树、公式、表格、图片、全文markdown等结果的获取函数;同时开源了前端可视化组件(+link),满足用户个性化的校对使用需求。
b_qixin1 年前
文档解析·合合信息ocr
合合信息文档解析Coze插件发布,PDF转Markdown功能便捷集成近日,TextIn开发的PDF转Markdown插件正式上架Coze平台。在扣子搜索“pdf转markdown”,或在Coze平台搜索“pdf2markdown”,即可找到插件,在你的专属智能体中便捷使用文档解析功能。
我码玄黄1 年前
java·apache·文档解析·tika
文件解析的终极工具:Apache TikaApache Tika 是一个开源的、跨平台的库,用于检测、提取和解析各种类型文件的元数据。它支持多种文件格式,包括文档、图片、音频和视频。