技术栈
rag
质造者
3 小时前
linux
·
人工智能
·
python
·
langchain
·
rag
LangChain + Ollama + Tavily 实现旅游问答系统
最近在学习 LangChain 框架和本地大模型 Ollama,动手写了一个景点 + 天气问答小项目。项目功能简单,主要用来练手 LangChain 常用组件、分支路由、并行调用等基础知识点,全程本地运行,不用额外付费,适合新手跟着敲代码学习。
质造者
9 小时前
开发语言
·
python
·
pdf
·
大模型
·
rag
Python 本地 RAG 实战 | Ollama+ChromaDB 实现 PDF 离线智能问答
标签:Python、RAG、大模型、Ollama、ChromaDB、本地知识库检索增强生成(RAG)是当前大模型落地应用最主流的方案。本项目全程本地离线运行,无需调用任何云端 API,不受 Token 额度限制,同时能有效保护本地文档隐私。
Devin~Y
9 小时前
java
·
spring boot
·
redis
·
spring cloud
·
微服务
·
rag
·
spring ai
大厂 Java 面试实战:从 Spring Boot 微服务到 AI RAG 音视频平台全链路解析
场景:互联网大厂——“云声视频内容社区”(音视频 + UGC + AIGC)角色:老程:我们是做音视频内容社区的,类似短视频 + 直播 + UGC 图文内容, 还有 AIGC 文本 + 图片生成,做推荐、搜索、IM、支付和本地生活服务, 你就按你熟悉的技术栈来聊。准备好了我们开始。
王小王-123
9 小时前
milvus
·
chroma
·
rag
·
智能体
·
bm25
·
检索增强生成
·
agentic rag
从 Chroma 到 Milvus:一套 Agentic RAG 知识库的工程实践
很多 RAG 演示项目看起来很简单:上传文档、切成文本块、生成向量、查询向量数据库,再把检索结果交给大模型回答。真正落到生产环境后才会发现,向量数据库只是整个链路中的一环。文档解析是否完整、切分是否破坏语义、用户问题是否被过度改写、候选结果如何融合、重排序接口是否正确,都会直接影响最终回答。
weixin_42232931
11 小时前
ai
·
rag
企业级 RAG 系统实战详解
一个完整的企业级 RAG 系统包含两条核心链路:离线文档处理链路和在线查询链路,两者通过向量库和反馈系统形成闭环。
海棠AI实验室
11 小时前
windows
·
算法
·
自动化
·
llm
·
rag
AI 时代文献综述:从检索到成稿的 RAG 五步法
写在前面:这是一篇写给程序员、算法工程师,以及所有被文献综述折磨过的工程师的文章。我们会讲清楚文献综述的核心概念(主题归纳 / 共识与分歧 / Gap)、AI 时代的RAG 思维(引用可追溯),以及一套可复用的通用五步法(检索 / 筛选 / 嵌入 / 提取 / 生成)。
黑马师兄
1 天前
java
·
人工智能
·
ai
·
agent
·
rag
·
ai-native
RAG混合检索深度解析:让AI真正找到你要的内容
向量检索(Dense Retrieval)是目前 RAG 系统的主流做法。它的核心思想是:将文档和用户问题都转换成高维数值向量(Embedding),然后通过计算两个向量之间的余弦相似度,找出语义上最接近的文档片段。
小程故事多_80
1 天前
java
·
开发语言
·
rag
RAGFlow 分块策略全景与 Book 策略深度解析
RAGFlow 一共有 15 种分块策略,定义在 common/constants.py 的 ParserType 枚举中,通过 rag/svr/task_executor.py 的 FACTORY 字典分发到各自的实现模块。
企业知识库布道者
1 天前
人工智能
·
ocr
·
私有化部署
·
知识库
·
rag
·
企业知识库
从 OCR 到文档结构理解:MinerU-Popo 对 RAG 文档解析链路的补全
MinerU-PopoOCR 解决的是“看见文字”的问题。在文档智能场景里,这一步很重要,但还不够。一个 PDF 被 OCR 之后,通常会得到一组页面级的结果:文本块、标题块、表格块、图片块、坐标、页码,以及一些模型识别出来的版面标签。它们能说明“这一页上有什么”,却不一定能说明“整篇文档在讲什么、这些内容之间是什么关系”。
程序员三明治
1 天前
人工智能
·
llm
·
知识库
·
元数据
·
rag
·
java后端
RAG 元数据的作用与管理:让知识库回答可追溯、可过滤、可维护
上一篇我们聊了 RAG 中的文本分块(Chunking):如何把长文档拆成适合检索的小块。分块解决的是“长文本如何变成可检索单元”的问题,但它没有回答另一个关键问题:这些文本块从哪里来、属于哪个业务范围、当前是否生效、谁可以查看、出了问题怎么回溯。
虎妞0500
2 天前
milvus
·
向量数据库
·
chroma
·
rag
·
weaviate
向量数据库选型指南:Milvus vs Chroma vs Weaviate
RAG 架构让向量数据库成为 AI 基础设施核心。与传统数据库不同,向量数据库专为高维向量相似性搜索设计。
染指1110
2 天前
人工智能
·
rag
·
advanced rag
21.RAG进阶(Advanced RAG)-RAG存在的问题(Advanced RAG)
内容参考于:图灵AI大模型全栈实现一个RAG的流程:首先加载文件,然后读取文件中的文本,然后分割文本,然后把文本转成向量,然后保存成知识库,然后把我们的问题也转成向量,然后使用问题的向量去知识库中搜索,把搜索到的知识添加到向ai大模型提问的提示词中,然后提交给大模型回答
SiYuanFeng
2 天前
人工智能
·
面试
·
transformer
·
agent
·
rag
大模型 / RAG / Agent 面试高频题
这篇文章《大模型 / RAG / Agent 面试基础高频题》,适合准备以下方向:(这里主要是介绍自己的项目,这里就不给出标准答案了)
codefan※
2 天前
大模型
·
llm
·
向量数据库
·
rag
Reranker 模型实战:让 RAG 检索精度再提升 20%
如果你做过 RAG(Retrieval-Augmented Generation)项目,一定遇到过这个痛点:**向量检索召回了 20 条文档,但真正相关的只有前 3 条,后面全是噪音。**这些噪音不仅浪费 Token,还会干扰 LLM 的推理,导致生成结果质量下降。
中草药z
2 天前
java
·
深度学习
·
机器学习
·
阿里云
·
rag
·
springai
【RAG】工程化实战:全链路原理复盘 + 方案选型 + 实战高阶玩法
🔥个人主页: Ryan🔥专栏:【后端】登神长阶 实战落地后端全路线手册在 AI 圈子里,一直流传着一个心照不宣的秘密:用 LangChain 或 LlamaIndex 几行代码搭一个 RAG(检索增强生成)系统,只需要一个下午;但要让它达到生产环境的落地上线标准,往往需要大半年。
码农飞哥
3 天前
python
·
知识库
·
向量检索
·
rag
·
效果提示
我把RAG召回率从60%提到90%,就改了这两件事
💪🏻 1. Python基础专栏,基础知识一网打尽,9.9元买不了吃亏,买不了上当。 Python从入门到精通
要开心吖ZSH
3 天前
java
·
ai
·
agent
·
健康医疗
·
rag
AI医疗分诊与健康咨询助手agent开发——(0)项目背景与概要
说起来这个想法不是突然冒出来的,是几条线慢慢汇到一起的。我目前在做互联网医院的项目,上线之后发现一个很明显的问题——我们的挂号流程是"直筒式"的:选医院,然后医院各科室列表摆在这儿,你自己选,自己挂。系统不会问你哪里不舒服,也不会帮你判断该挂哪个科。结果就是,患者挂错科的情况时有发生。每次看到客服反馈过来的这类工单,我心里就想:这个环节,明显是能用技术优化的。
星马梦缘
4 天前
人工智能
·
rag
·
提示词工程
·
mcp
提示词工程 与 实践 合集
大型语言模型本质上是一个黑箱,而提示就是我们与它沟通的唯一接口。就像我们使用自然语言与人交流一样,提示也是我们向LLM下达指令、描述任务、提供上下文的主要方式。
小刘|
4 天前
langchain
·
rag
揭秘RAG:检索增强生成技术解析
什么是 RAG?RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合了 信息检索 与 大语言模型 的技术框架。它旨在通过引入外部知识源,弥补大模型在事实性、时效性及私有化知识方面的短板。
菜到离谱但坚持
4 天前
python
·
langchain
·
rag
【小白零基础】RAG+LangChain 搭建私有知识库问答系统(完整可运行代码+超详细教程+避坑指南)
收藏⭐ + 点赞👍 + 关注✅ 零基础入门大模型RAG应用,保姆级教程,新手零翻车!哈喽大家好!很多刚入门大模型的小伙伴都有一个疑问:如何让AI学习自己的私有资料?