技术栈
文档分块
北京地铁1号线
18 天前
知识图谱
·
文档分块
1.2 文本分块策略(Chunking)
在自然语言处理和信息检索中,处理长文档时面临以下挑战:分块的核心目标:在保持语义连贯性的前提下,将长文本分解为可管理的片段。
linmoo1986
2 年前
embedding
·
向量数据库
·
rag
·
pypdf
·
文档分块
·
pdfminer
检索增强生成RAG系列3--RAG优化之文档处理
在上一章中罗列了对RAG准确度的几个重要关键点,主要包括2方面,这一章就针对其中一方面,来做详细的讲解以及其解决方案。
我是有底线的