技术栈
rag
Mr.Daozhi
5 小时前
前端
·
数据库
·
langchain
·
大模型
·
gradio
·
rag
·
科研工具
RAG 进阶实战:跑通 Demo 后我连续翻了 6 次车,逐一修复才真正可用(含 Gradio Web 版)
写在前面: 本文是本地 RAG 文献知识库的进阶实战篇,假设你已经完成了 WSL2 + Ollama + ChromaDB 的基础环境搭建。如果还没搭好,建议先看入门篇打好基础,再来看本文。
Mr. zhihao
14 小时前
python
·
rag
·
bm25
BM25 混合检索详解:为什么向量检索不够,还要加一个关键词检索
本文用一个国标 RAG 的真实查询场景,说明 BM25 解决了什么问题、什么时候必须用它、以及怎么和向量检索做混合。
虾..
14 小时前
人工智能
·
llm
·
rag
大模型认识
我们平常日常使用的豆包,千问,deekseep,chatgpt其实都是大语言模型。例如我们想学会⼀⻔外语,但没有⽼师给出题和批改。怎么办?
亦暖筑序
1 天前
知识图谱
·
neo4j
·
向量数据库
·
rag
·
spring ai
·
graphrag
GraphRAG vs 传统向量RAG:Spring AI实战对比
传统向量RAG找答案快,但多跳推理弱。GraphRAG能理清实体关系,但构建成本高。什么时候用什么?看完这篇你就清楚了。
染指1110
1 天前
人工智能
·
langchain
·
rag
12.LangChain框架4-输出解释器
内容参考于:图灵AI大模型全栈LangChain输出解释器,大模型的返回数据是可以进行限制的,之前是使用的提示词进行的限制,就是说可以让大模型给我们返回XML、JSON、CSV(以列表形式返回)
SLD_Allen
2 天前
架构
·
rag
·
agentic rag
·
classic rag
·
graph rag
RAG三大主流架构:Classic RAG、Graph RAG、Agentic RAG的区别
绝大多数团队第一次将大模型接入业务系统时,都会萌生同一个想法:能不能让AI直接解答公司内部文档相关的问题?
2601_95788224
2 天前
重构
·
音视频
·
geo
·
rag
·
多模态模型
多模态RAG与视觉红利:GEO(生成式引擎优化)中的图片与视频资产重构策略
大语言模型(LLM)的演进速度超乎想象。随着 GPT-4o、Gemini 1.5 Pro 以及国内诸多原生多模态大模型的发布,AI搜索引擎(如各大厂的AI助手、智能搜索插件)的输入输出已经不再局限于纯文本。
小当家.105
2 天前
数据库
·
人工智能
·
postgresql
·
rag
PostgreSQL 做向量数据库:pgvector 在 RAG 中的实战与多场景适配
你可能不需要一个独立的向量数据库。做 RAG 的第一步是选向量数据库。市面上的选项很多:Milvus、Qdrant、Weaviate、Pinecone、Chroma……但对于已经在用 PostgreSQL 的 Java 项目来说,有一个选项经常被低估——pgvector。
jiayong23
2 天前
ai
·
架构
·
rag
·
智能体
RAG系列(三):实践案例与高级优化
Python客户端示例:自动从用户问题中提取过滤条件:支持多轮对话,保持上下文:让LLM自主决定何时检索:
java1234_小锋
2 天前
java
·
人工智能
·
spring
·
rag
什么是 RAG(检索增强生成)?请简述 Spring AI 实现 RAG 的完整流程,包括涉及的核心组件。
RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合了信息检索和自然语言生成(NLG)技术的模型。其核心思想是,在生成文本之前,首先通过检索机制获得相关的外部信息,以增强生成内容的质量和准确性。这种方法特别适用于需要丰富知识或上下文信息的应用场景,例如问答系统、聊天机器人和内容生成。
中间件XL
3 天前
rag
·
ai agent
·
智能体
·
spring ai
ai-agent框架spring ai/alibaba(四) RAG
saa是java的ai agent框架,本系列将深入剖析 Spring AI Alibaba 的源码实现与核心原理,不仅可以指导agent的开发,更可以改造框架,增加新特性
小碗羊肉
3 天前
笔记
·
agent
·
rag
【Agent笔记 | 第三篇】RAG优化
目录1. 为什么要加 Rerank(重排)?2. Recall@K 和 Precision@K 怎么取舍?
填满你的记忆
3 天前
java
·
ai
·
agent
·
rag
《RAG 完整工作流程详解》
在前一篇文章中,我们聊了什么是 RAG 以及为什么它会成为当前企业级 AI 项目的“标配”。简单来说,RAG 就是让大模型在回答问题前先“开卷翻书”。
Cosolar
3 天前
人工智能
·
面试
·
大模型
·
agent
·
rag
2026 年 AI 开源生态全景图
数据来源:GitHub API | 采集日期:2026-05-27 | 所有数据可查证
Irissgwe
3 天前
langchain
·
检索器
·
向量存储
·
rag
·
langgraph
九、LangChain之核心组件--(7)文本向量(下)
在 LangChain 中,实际并不需要我们直接手动调用嵌入模型去生成向量,然后手动去比较向量。在我们之前提供的 RAG 知识地图中,存在一个 Vector Stores 向量存储,如下图所示:
qqxhb
3 天前
微调
·
prompt
·
rag
30|什么时候需要 RAG:直接 Prompt/微调/RAG 的决策
欢迎来到 卷 4:知识与数据。 在前面的章节里,我们赋予了 AI 思考的框架(Prompt)和行动的手脚(MCP/Skills)。但如果现在你问 AI:“咱们公司昨天发布的新产品,退款政策是什么?”它一定会胡编乱造。 为什么?因为它脑子里只有它被“训练”时(通常是一年甚至更久以前)互联网上的公开数据,它完全不知道你们公司的内部机密和最新动态。
AI-Frontiers
3 天前
rag
RAG系列:#5 RAG中的11种分块策略
原文:https://mp.weixin.qq.com/s/Yax05qsVj1tXi77za8Wm2g 欢迎关注公zh: AI-Frontiers
.唉
3 天前
算法
·
rag
10. 向量数据库常用检索算法
摘要:这是一篇关于向量数据库核心检索算法的技术博客,主要面向计算机专业学生或开发者。文章深入解析了从暴力搜索到近似最近邻(ANN)的演进,重点对比了IVF(倒排文件索引)和HNSW(分层导航小世界)两种主流算法的原理、核心参数及适用场景,旨在帮助读者理解算法背后的工程权衡,以便在实际业务中进行合理选型。
小新同学^O^
4 天前
人工智能
·
学习
·
架构
·
向量数据库
·
rag
简单学习 --> Rag
在计算机架构中,CPU 的算力再强,也受限于 L1/L2 缓存和内存的大小。LLM(大语言模型)同理:它的权重矩阵(模型本身)相当于只读存储器(ROM),而它的上下文窗口(Context Window)相当于极其昂贵的运行内存(RAM)。
养肥胖虎
4 天前
llm
·
embedding
·
rag
完整学习LLM(五):Embedding是什么,为什么文本能变成向量
好家伙, 先贴一篇好文章 https://developers.openai.com/api/docs/guides/embeddings (openai团队写的,值得信赖)