rag

小白狮ww7 小时前
人工智能·知识库·多智能体·rag·ai学习工具·deeptutor·交互式学习
个人学习助手 DeepTutor:把论文检索、做题和学习规划一次打通别的不说,现在 AI 学习工具也开始卷出「家教界六边形战士」了。前脚还在手动整理笔记、翻论文、刷题找答案,后脚 DeepTutor 就直接把「学习」这件事做成了全自动流水线。
敲个大西瓜13 小时前
rag
RAG(二)PGVector 是 PostgreSQL 的向量扩展,让 PostgreSQL 直接支持向量存储和相似度搜索。 PGVector 给 PostgreSQL 加了一个新的数据类型 VECTOR,可以在普通的表里加一列向量,然后对这列向量做相似度搜索。 运算符 距离类型 适用场景 <-> 欧氏距离(L2) 坐标空间,对向量幅度敏感 <=> 余弦距离 文本语义搜索首选,只看方向不看幅度 <#> 内积(负数) 向量已归一化时等效于余弦距离 文本 RAG 场景几乎都用余弦距离。原因是:不同长度的文本,Embedd
不爱洗脚的小滕16 小时前
网络·langchain·milvus·rag
【RAG】Milvus 混合检索参数调优:ef / candidate_k / final_k 详解若两路各取 5 条,真正相关的结果 X 在稠密路排第 6,RRF 融合时根本看不到 X, 导致好结果被漏掉。candidate_k 放大后,X 参与融合,最终得分提升,有机会进入 top-k。
codefan※19 小时前
知识图谱·milvus·faiss·向量数据库·rag·qdrant
RAG 加速指南:Faiss / Milvus / Qdrant 向量库选型与调优三大主流向量数据库深度实测,附 Docker 一键部署配置与性能调优参数向量数据库是 RAG(检索增强生成)系统的核心基础设施。当你的知识库从几千条增长到百万、千万级时,向量检索的性能瓶颈就会彻底拖垮你的 AI 应用响应速度。
abigale0320 小时前
缓存·langchain·prompt·token·rag·lcel
LangChain 实践4: 7个人AI助手全栈项目:完整拆解+分阶段开发指南本项目是一个从零搭建的全栈AI实战项目,覆盖大模型应用开发全链路核心技术。下文结合项目整体架构、功能模块与落地流程,拆解出7个递进式开发阶段,按照规划逐步开发,即可完成从本地调试到线上部署的完整流程。
程序员三明治21 小时前
java·人工智能·后端·ai·大模型·llm·rag
【AI】RAG 数据分块(Chunk)策略与实践本文面向正在建设 RAG 知识库问答系统的开发者,围绕“为什么需要分块、如何设置 chunk_size 与 overlap、常见分块策略如何选择”展开说明。示例场景统一替换为在线教育平台的课程预约与教务服务知识库;技术链路、参数权衡和性能优化思路保持不变。
咖啡星人k21 小时前
大数据·人工智能·架构·rag·mcp·百智云
长亭百智云:全新一代AI基础服务平台深度解读长亭百智云(baizhi.cloud)是由长亭科技推出的全新一代 AI 基础服务平台,定位为面向开发者和企业的一站式 AI 能力中心。平台目前提供 14 个在线产品,涵盖 API、模型、能力型服务等多种形态,可直接作为底层能力接入业务系统,帮助团队快速构建 AI 应用而无需从零搭建基础设施。
不爱洗脚的小滕1 天前
langchain·aigc·ai编程·rag
【RAG】召回(Retrieval)与重排(Rerank)核心技术要点汇总在检索增强生成(RAG)架构中,召回与重排处于不同的阶段,承担不同的职责:在工业级高并发场景中,禁止在业务代码中直接同步加载模型推理,主流做法分为两类:
deephub2 天前
人工智能·大语言模型·rag·视频分块
视频 RAG 中分块策略:基于停顿、滑动窗口与基于 LLM 的方法文本的RAG我们都已经很熟悉了,但是如果数据以原始视频转录文本的形式存储,没有合适的时间结构,那么相比标准的 PDF 或文本文档,如何检索视频里面的内容呢? 针对同样的问题还可以换一个更高层次的问法:
Maiko Star2 天前
人工智能·rag·springai
理解 RAG 的“为什么”与 Spring AI 实战初体验任何大模型都有两个硬伤,不解决就没法直接回答很多真实问题:训练截止日期 模型的知识来自训练数据,训练完成那一刻知识就凝固了。问它“上周的股价是多少”,答不了;问它“最新政策有什么变化”,也答不了。
小何code2 天前
embedding·向量数据库·rag·检索增强生成·llm应用
人工智能【第52篇】RAG系统实战:检索增强生成技术详解作者的话:大语言模型虽然强大,但存在知识截止、幻觉等问题。RAG(检索增强生成)技术通过将外部知识库与LLM结合,让模型能够基于最新、最准确的信息回答问题。本文将深入解析RAG的原理、架构设计,并带你从零构建一个完整的RAG系统!
提笔了无痕2 天前
数据库·ai·rag
RAG存储策略中.md格式的切片与存储怎么处理先说结论:语法结构+语义切片+父子检索Markdown 不是纯文本,也不是富文本,它恰好站在中间——既有明确的语法结构,又以纯文本形态存在。这给了你三种切片策略完美的施展空间:
张彦峰ZYF2 天前
数据库·大模型·rag
检索增强生成(RAG)系统的基础:全面深入矢量数据库目录一、快速走进矢量数据库(一)从“照片检索”理解向量数据库的相似性搜索机制(二)同一句话的不同说法:向量数据库如何找到“同一个意思”?
格桑阿sir3 天前
ai·大模型·llm·embedding·agent·检索增强·rag
10-大模型智能体开发工程师:RAG检索增强生成系列文章导航:AI系列文章导航目录-持续更新中📝 本文摘要:本文详解RAG技术——解决LLM知识局限(训练数据截止、私有数据未知、专业领域不精)的核心方案,梳理RAG流程(离线索引:文档→分块→嵌入→向量数据库;在线查询:嵌入→向量检索→Top-K→拼接到Prompt→LLM生成),详解关键技术(分块策略、嵌入模型选择、向量数据库选型、混合检索、重排序),提供最简RAG和生产级RAG架构代码,以及常见问题优化。
qcx233 天前
人工智能·rag·评测
【系统学AI】15 RAG评测体系:RAGAS四维+TruLens+ARES全套方案title: “RAG评测体系(2026版):RAGAS四维+TruLens+ARES全套方案” excerpt: “Faithfulness/Answer Relevancy/Context Precision/Context Recall四维评测+LLM-as-Judge最佳实践+持续监控+A/B测试” cover: rag-evaluation-cover.png tags: RAG评测, RAGAS, TruLens, ARES, LLM-as-Judge, 评测框架
caicongyang3 天前
rag·llmwiki
LLM Wiki 深度解读与接入指南围绕一个常见误解展开:llmwiki 不是"提前把文档解析成 wiki"的 RAG,而是把 LLM 当成 wiki 编辑员的脚手架。本文先讲清楚架构,再说怎么把它当知识库接到 Claude Code 这类 agent 上替代 RAG。
Mr.Daozhi3 天前
前端·数据库·langchain·大模型·gradio·rag·科研工具
RAG 进阶实战:跑通 Demo 后我连续翻了 6 次车,逐一修复才真正可用(含 Gradio Web 版)写在前面: 本文是本地 RAG 文献知识库的进阶实战篇,假设你已经完成了 WSL2 + Ollama + ChromaDB 的基础环境搭建。如果还没搭好,建议先看入门篇打好基础,再来看本文。
Mr. zhihao4 天前
python·rag·bm25
BM25 混合检索详解:为什么向量检索不够,还要加一个关键词检索本文用一个国标 RAG 的真实查询场景,说明 BM25 解决了什么问题、什么时候必须用它、以及怎么和向量检索做混合。
虾..4 天前
人工智能·llm·rag
大模型认识我们平常日常使用的豆包,千问,deekseep,chatgpt其实都是大语言模型。例如我们想学会⼀⻔外语,但没有⽼师给出题和批改。怎么办?
亦暖筑序5 天前
知识图谱·neo4j·向量数据库·rag·spring ai·graphrag
GraphRAG vs 传统向量RAG:Spring AI实战对比传统向量RAG找答案快,但多跳推理弱。GraphRAG能理清实体关系,但构建成本高。什么时候用什么?看完这篇你就清楚了。