技术栈
rag
养肥胖虎
4 小时前
ai
·
微调
·
rag
RAG学习笔记(2):关于rag和模型微调,同一个问题它们分别怎么处理
好家伙,今天我们来聊一个很容易混在一起的问题:这两个东西看起来都能让大模型回答得更贴近业务.但它们解决的问题其实不一样.
梦想不只是梦与想
6 小时前
llm
·
智能问答
·
rag
·
reranker
·
embedding model
构建智能问答或RAG系统:三个关键组件
“大模型”通常指的是大语言模型(Large Language Model, LLM),而“大预言、嵌入模型、重排序模型”并不是大模型本身的三种类型,而是在构建智能问答或检索增强生成(RAG)系统时,常协同使用的三个关键组件。它们各自承担不同角色,共同提升系统整体性能。
小马过河R
8 小时前
人工智能
·
python
·
算法
·
ai
·
llm
·
rag
·
问答
RAG检索优化策略:系统性四层框架解析
RAG在今天已经不是什么稀奇玩意了,懂或不懂的多多少少都会讲出点门道。小马之前也介绍过相关的文章链接: 《RAG检索增强生成:通过重排序提升AI信息检索精准度》。至于RAG的具体原理小马再次就不做赘述了。然而在实际的真实场景中,往往会面临着真实效果的上限问题,通用的RAG似乎都无法满足特定化的业务场。于是,我们往往需要针对其做特定业务的召回优化(专属)。
knight_9___
14 小时前
人工智能
·
python
·
深度学习
·
面试
·
agent
·
rag
·
mcp
大模型project面试5
DPO 和 PPO 都是大模型对齐训练里的方法,都是在 SFT 之后让模型的输出更符合人类期望。PPO 是强化学习里的一个算法,在大模型里的用法是:先额外训练一个「奖励模型」来给模型的回答打分,然后用 PPO 这个 RL 算法不断调整大模型的参数,让它生成的内容往高分方向走。这套流程需要同时维护好几个模型,工程复杂度高,训练也容易不稳定,所以成本比较大。
knight_9___
14 小时前
人工智能
·
python
·
agent
·
rag
·
mcp
大模型project面试6
我理解 KV Cache 和 Prompt Caching 是同一个机制在两个时间尺度上的应用。KV Cache 是「单次推理内」的优化。自回归生成时,每次生成新 token 都要让模型重新对前面所有 token 算 attention。如果每次都从零开始算,N 个 token 的总计算量是 O(N³),根本不可接受。KV Cache 把前面所有 token 的 K 和 V 矩阵缓存在 GPU 显存里,每次新 token 只算自己的 Q、K、V,然后跟缓存的 K/V 做 attention,把总计算量从
小小工匠
17 小时前
rag
·
spring ai
·
热词统计
Spring AI RAG - 07 AOP 日志记录与热词统计
知识库系统的运营离不开两类数据:用户在问什么(热词分析)、系统在做什么(操作日志)。前者帮助优化知识库内容,后者用于审计和排障。
小小工匠
17 小时前
rag
·
spring ai
·
websearch
Spring AI RAG - 14 网络检索增强:Web Search 集成
RAG 系统的知识范围天然受限于已上传的文档。如果用户问的是"今天的股市行情"或"最新版本的 Spring AI",再完美的内部知识库也无能为力——这些信息根本没有被入库过。
wuxinyan123
1 天前
人工智能
·
学习
·
rag
工业级大模型学习之路012:RAG 零基础入门教程(第七篇):高级检索架构(解决分块不合理问题)
现在使用的固定大小分块(如 512token / 块)是最简单也是最常用的分块方法,但它存在三个无法解决的根本性问题,这也是 90% 的 RAG 系统回答质量差的根源。
CSharp精选营
1 天前
rag
·
向量搜索
·
ef core
·
mcp
·
.net 11
AI 开发狂飙!.NET 11 Preview 4 原生集成向量搜索 + MCP 模板,EF Core 直接对标 RAG 应用
大家好,我是码农刚子。微软官方在 .NET 11 Preview 4 发布公告中直言:“向量搜索是原生 AI 开发的核心构件之一。”当语义搜索遇上标准化 AI 工具调用协议,.NET 从高性能框架向 AI 原生开发平台的关键一步,正式落地。
千桐科技
2 天前
人工智能
·
大模型
·
知识图谱
·
agent
·
rag
·
qknow
·
智能体构建平台
qKnow 智能体构建平台知识图谱能力优化:围绕图谱探索、知识库、数据源、知识推理、知识融合与概念属性的完善升级
随着企业知识智能化建设的不断深入,知识图谱、知识库 RAG、Bot 构建以及 AI 应用落地,正在成为企业构建知识中枢和智能应用平台的重要能力。
养肥胖虎
2 天前
ai
·
知识库
·
rag
RAG学习笔记:让大模型先查资料再回答问题
好家伙,这次我们来聊 RAG.RAG 这个词最近出现得很多,但如果只是记住它的英文全称,其实没什么用.
进击切图仔
2 天前
python
·
huggingface
·
rag
从零手写 RAG
本文将带你抛开 LangChain 等封装框架,用最基础的库从零构建一个检索增强生成(RAG)系统。我们将使用 sentence-transformers 生成嵌入向量,faiss 进行向量相似度检索,OpenAI Python SDK 调用 DeepSeek 大模型。每一步都会用通俗的语言解释“为什么这么做”,让 RAG 的核心原理一览无遗。如果你曾困惑于框架的“黑盒”,这篇教程会让你真正掌握 RAG 的骨架。
爱跑步的程序员~
3 天前
python
·
ai
·
langchain
·
rag
RAG 技术全面解析:从原理到实践
在前面的章节中,大模型本质上是基于自身的训练语料和概率统计,结合用户的 prompt 来预测下一个 token(词或符号)的出现概率。这就意味着:模型输出的文本是"语言上最合理"的,但未必是"事实上的正确"。
deephub
3 天前
人工智能
·
全文检索
·
大语言模型
·
rag
HyDE :让 RAG 检索从“匹配关键词“升级到“理解意图“
做过检索增强生成(Retrieval-Augmented Generation,RAG)的人大概都遇到过这样的情况:用户问了一个完全合理的问题,但检索就是漏掉了最相关的信息。
梦想不只是梦与想
3 天前
人工智能
·
python
·
知识库
·
rag
·
智能体
·
agent
rag和agent的区别
RAG 和 Agent 的核心区别在于目标不同:RAG 是为了答得准,Agent 是为了做得成。简单来说,RAG 像资料员,负责查资料;Agent 像项目经理,负责办事情。
不懂的浪漫
4 天前
ai
·
cnn
·
llm
·
transformer
·
rag
从看清到理解:CNN、Transformer 与 RAG 背后的 AI 架构迁徙
一个 CV 旧人眼中的模型范式迁移:从视觉识别、语义建模,到外部知识与 Agent 系统。今天很多人一提 RAG,就直接想到向量数据库。这个联想并不奇怪,因为向量数据库确实是 RAG 最常见的基础设施之一。
qcx23
4 天前
算法
·
ai
·
llm
·
agent
·
rag
·
agentic
混合检索+重排序:当前 RAG 精度提升最成熟的工程路径
RAG 的回答有引用,但引用是真的吗?这篇论文用"混合检索→重排序→保守生成→逐条验证"四步流水线,在生物医疗 QA 上做到了 100% 引用准确率。方法不炫,但管用。
deephub
4 天前
人工智能
·
python
·
大语言模型
·
rag
2026 RAG 选型指南:Vector、Graph、Vectorless 该怎么挑
检索找到了某个语义上接近的片段,LLM 围绕它写出一段文字,但是没人发现答案是错的。这是 vector RAG 调参解决不了的失败问题。而现在有2种方法可以解决他:
Komorebi_9999
5 天前
rag
RAG-day9
人话:按关键词匹配就像百度搜东西,你输几个字,它找包含这些字的文章。举例子:你搜 “乌干达鲜鱼检疫标准”稀疏检索只找包含这几个字的文档。
Komorebi_9999
5 天前
rag
RAG-day11
问题:只靠语义匹配,遇到专业名词、法规编号、固定关键词,搜不到、匹配不准。解决:必须搭配 ES 关键词稀疏检索,做混合检索。