技术栈

docling

还是码字踏实
12 天前
docling·rag冠军方案·tableformer·小块检索 + 大块阅读·表格序列化并不好·indexflatip·llm reranking
Enterprise RAG Challenge 冠军方案深度拆解:研报级学习笔记方案来源: Ilya Rice — How I Won the Enterprise RAG Challenge | 开源代码 成绩: 两个奖项类别均第一 + SotA榜首 | 核心模型: GPT-4o-mini (Reranking) + o3-mini (Answering)
AlfredZhao
2 个月前
ai·rag·docling
RAG 时代的“破壁人”:为什么你的大模型应用急需 Docling?在 RAG(检索增强生成)的开发圈子里,有一句流传甚广的“黑话”:“垃圾进,垃圾出(Garbage In, Garbage Out)。” 无论你的向量数据库有多快,大模型(LLM)的推理能力有多强,如果最开始喂给它的文档数据是一团乱麻,那最终的回答效果一定不尽如人意。正是在这种背景下,IBM 开源的 Docling 像一匹黑马,迅速成为了 RAG 领域的“新宠”。
我不是小upper
10 个月前
图像处理·人工智能·markdown·marker·docling
PDF转Markdown基准测试哈喽,大家好,我是我不是小upper~今天给大家介绍一下PDF转Markdown基准测试,咱们可以通过将文档中的附加知识融入提示词,通常可以提升大语言模型(LLM)生成的答案质量。
我是有底线的