技术栈
rag
wuxinyan123
16 小时前
人工智能
·
学习
·
rag
工业级大模型学习之路013:RAG零基础入门教程(第九篇):RAG幻觉治理
RAG 幻觉是指大模型生成的回答中包含了检索上下文中不存在的、未经证实的或错误的信息。即使检索到了正确的信息,大模型仍然可能编造内容,这是 RAG 系统从 "能用" 到 "好用" 的最大障碍。
wuxinyan123
16 小时前
人工智能
·
python
·
学习
·
重构
·
rag
工业级大模型学习之路015:RAG零基础入门教程(第十一篇):系统重构与代码规范化
经过多年的实践,工业界已经形成了一套成熟的 RAG 系统分层架构,它将系统划分为多个独立的模块,每个模块有明确的职责,模块之间通过统一的接口进行交互。
wuxinyan123
16 小时前
人工智能
·
学习
·
rag
工业级大模型学习之路014:RAG零基础入门教程(第十篇):系统性能与资源优化
本地 RAG 与云服务 RAG 的性能瓶颈完全不同,云服务的瓶颈主要在网络和并发,而本地 RAG 的瓶颈全部集中在单机资源上。
YDS829
17 小时前
java
·
springboot
·
agent
·
rag
·
deepseek
DeepSeek RAG&MCP + Agent智能体项目 —— 环境搭建和项目初始化
在将Java后端的基本功打扎实后,我将学习目前更加前沿的Agent开发领域,Agent开发本质其实只是后端技术的延伸,需要和后端技术配合才能发挥真正的功效,所以在进行AI领域开发前,我已经完成了很多个纯后端的业务项目了。
要开心吖ZSH
17 小时前
java
·
ai
·
agent
·
rag
Java AI Agent 开发中的 RAG 实现方案及小白入门指南
ps:(1)现在AI发展太快了,获取知识的方式比前些年更加便捷,但是AI容易出现幻觉,所以学习过程中大家要有分辨是非的能力 (2)先广再深:因为技术实在太多了,发展实在太快了,你不可能啥都能掌握的很深。所以,我感觉目前的学习方式,是先提升自己的知识面,提升知识的广度,然后你用到的时候再去深挖(当然我是根据自己一个普通人的观点去看的,如果是那些天才与大神,可以忽略,毕竟每个人的学习方式有所不同,仅供参考!) (3)这里通过ai辅助,和大家一块学习Java AI Agent 开发——共勉!!!
__土块__
18 小时前
人工智能
·
技术分享
·
rag
·
ai技术
·
检索增强生成
RAG技术详解与应用实践
RAG(Retrieval-Augmented Generation)是一种革命性的AI技术,它通过结合检索和生成的方式来增强大语言模型的能力。这种技术解决了传统大语言模型在知识更新和准确性方面的局限。
养肥胖虎
1 天前
ai
·
微调
·
rag
RAG学习笔记(2):关于rag和模型微调,同一个问题它们分别怎么处理
好家伙,今天我们来聊一个很容易混在一起的问题:这两个东西看起来都能让大模型回答得更贴近业务.但它们解决的问题其实不一样.
梦想不只是梦与想
1 天前
llm
·
智能问答
·
rag
·
reranker
·
embedding model
构建智能问答或RAG系统:三个关键组件
“大模型”通常指的是大语言模型(Large Language Model, LLM),而“大预言、嵌入模型、重排序模型”并不是大模型本身的三种类型,而是在构建智能问答或检索增强生成(RAG)系统时,常协同使用的三个关键组件。它们各自承担不同角色,共同提升系统整体性能。
小马过河R
1 天前
人工智能
·
python
·
算法
·
ai
·
llm
·
rag
·
问答
RAG检索优化策略:系统性四层框架解析
RAG在今天已经不是什么稀奇玩意了,懂或不懂的多多少少都会讲出点门道。小马之前也介绍过相关的文章链接: 《RAG检索增强生成:通过重排序提升AI信息检索精准度》。至于RAG的具体原理小马再次就不做赘述了。然而在实际的真实场景中,往往会面临着真实效果的上限问题,通用的RAG似乎都无法满足特定化的业务场。于是,我们往往需要针对其做特定业务的召回优化(专属)。
knight_9___
2 天前
人工智能
·
python
·
深度学习
·
面试
·
agent
·
rag
·
mcp
大模型project面试5
DPO 和 PPO 都是大模型对齐训练里的方法,都是在 SFT 之后让模型的输出更符合人类期望。PPO 是强化学习里的一个算法,在大模型里的用法是:先额外训练一个「奖励模型」来给模型的回答打分,然后用 PPO 这个 RL 算法不断调整大模型的参数,让它生成的内容往高分方向走。这套流程需要同时维护好几个模型,工程复杂度高,训练也容易不稳定,所以成本比较大。
knight_9___
2 天前
人工智能
·
python
·
agent
·
rag
·
mcp
大模型project面试6
我理解 KV Cache 和 Prompt Caching 是同一个机制在两个时间尺度上的应用。KV Cache 是「单次推理内」的优化。自回归生成时,每次生成新 token 都要让模型重新对前面所有 token 算 attention。如果每次都从零开始算,N 个 token 的总计算量是 O(N³),根本不可接受。KV Cache 把前面所有 token 的 K 和 V 矩阵缓存在 GPU 显存里,每次新 token 只算自己的 Q、K、V,然后跟缓存的 K/V 做 attention,把总计算量从
小小工匠
2 天前
rag
·
spring ai
·
热词统计
Spring AI RAG - 07 AOP 日志记录与热词统计
知识库系统的运营离不开两类数据:用户在问什么(热词分析)、系统在做什么(操作日志)。前者帮助优化知识库内容,后者用于审计和排障。
小小工匠
2 天前
rag
·
spring ai
·
websearch
Spring AI RAG - 14 网络检索增强:Web Search 集成
RAG 系统的知识范围天然受限于已上传的文档。如果用户问的是"今天的股市行情"或"最新版本的 Spring AI",再完美的内部知识库也无能为力——这些信息根本没有被入库过。
wuxinyan123
2 天前
人工智能
·
学习
·
rag
工业级大模型学习之路012:RAG 零基础入门教程(第七篇):高级检索架构(解决分块不合理问题)
现在使用的固定大小分块(如 512token / 块)是最简单也是最常用的分块方法,但它存在三个无法解决的根本性问题,这也是 90% 的 RAG 系统回答质量差的根源。
CSharp精选营
2 天前
rag
·
向量搜索
·
ef core
·
mcp
·
.net 11
AI 开发狂飙!.NET 11 Preview 4 原生集成向量搜索 + MCP 模板,EF Core 直接对标 RAG 应用
大家好,我是码农刚子。微软官方在 .NET 11 Preview 4 发布公告中直言:“向量搜索是原生 AI 开发的核心构件之一。”当语义搜索遇上标准化 AI 工具调用协议,.NET 从高性能框架向 AI 原生开发平台的关键一步,正式落地。
千桐科技
3 天前
人工智能
·
大模型
·
知识图谱
·
agent
·
rag
·
qknow
·
智能体构建平台
qKnow 智能体构建平台知识图谱能力优化:围绕图谱探索、知识库、数据源、知识推理、知识融合与概念属性的完善升级
随着企业知识智能化建设的不断深入,知识图谱、知识库 RAG、Bot 构建以及 AI 应用落地,正在成为企业构建知识中枢和智能应用平台的重要能力。
养肥胖虎
3 天前
ai
·
知识库
·
rag
RAG学习笔记:让大模型先查资料再回答问题
好家伙,这次我们来聊 RAG.RAG 这个词最近出现得很多,但如果只是记住它的英文全称,其实没什么用.
进击切图仔
3 天前
python
·
huggingface
·
rag
从零手写 RAG
本文将带你抛开 LangChain 等封装框架,用最基础的库从零构建一个检索增强生成(RAG)系统。我们将使用 sentence-transformers 生成嵌入向量,faiss 进行向量相似度检索,OpenAI Python SDK 调用 DeepSeek 大模型。每一步都会用通俗的语言解释“为什么这么做”,让 RAG 的核心原理一览无遗。如果你曾困惑于框架的“黑盒”,这篇教程会让你真正掌握 RAG 的骨架。
爱跑步的程序员~
4 天前
python
·
ai
·
langchain
·
rag
RAG 技术全面解析:从原理到实践
在前面的章节中,大模型本质上是基于自身的训练语料和概率统计,结合用户的 prompt 来预测下一个 token(词或符号)的出现概率。这就意味着:模型输出的文本是"语言上最合理"的,但未必是"事实上的正确"。
deephub
4 天前
人工智能
·
全文检索
·
大语言模型
·
rag
HyDE :让 RAG 检索从“匹配关键词“升级到“理解意图“
做过检索增强生成(Retrieval-Augmented Generation,RAG)的人大概都遇到过这样的情况:用户问了一个完全合理的问题,但检索就是漏掉了最相关的信息。