技术栈
rag
Flying pigs~~
2 分钟前
agent
·
milvus
·
rag
·
智能体
·
检索增强生成
RAG 项目完整学习笔记与总结
这是一个生产级的多层 RAG 问答系统,核心特点:多级检索降级:Redis 缓存 → BM25 关键词检索 → Milvus 向量检索,层层递进
Flying pigs~~
1 小时前
人工智能
·
redis
·
mysql
·
docker
·
prompt
·
milvus
·
rag
企业级模块化RAG项目(mysql➕redis➕milvus➕模型微调➕bm25➕fastapi➕ollama➕Prompt➕多策略选择)
一个完整的 RAG 系统涉及多个技术组件,每个组件的选型都直接影响系统的性能、成本和可维护性。本文档详细分析本项目各项技术选型的考量因素及竞品对比。
rising start
1 小时前
embedding
·
dify
·
rag
RAG入门与在Dify中的简单实践
本文将带你完成 RAG 技术从理论到实战的全流程。我们以 长江科技有限公司内部知识库:新员工入职指南问答助手 为例,基于 Dify 平台进行实操演示,每一步都会给出具体的操作指引与最佳实践建议。
究极无敌暴龙战神X
20 小时前
自然语言处理
·
llama
·
rag
RAG基本流程
RAG(Retrieval-Augmented Generation,检索增强生成)是一种将外部知识检索与大语言模型(LLM)生成能力相结合的技术,用于提升回答的准确性、减少“幻觉”(Hallucination),并支持私有或实时数据。
竹之却
1 天前
人工智能
·
大模型
·
检索增强
·
faiss
·
rag
【Agent-阿程】AI先锋杯·14天征文挑战第14期-第6天-大模型RAG检索增强生成实战
技术标签:人工智能、大模型、RAG、检索增强、LangChain、向量数据库、FAISS大模型训练数据存在时间截止点,无法获取训练后新增的知识,回答易出现过时、错误、幻觉。
guslegend
2 天前
人工智能
·
架构
·
大模型
·
rag
第10节:设计高效混合检索架构,提升召回精度
RAG与Agent性能调优:第8节:打造可配置,可扩展的自动化预处理流水线Gitee地址:https://gitee.com/agiforgagaplus/OptiRAGAgent
Flying pigs~~
2 天前
运维
·
人工智能
·
docker
·
容器
·
大模型
·
agent
·
rag
检索增强生成RAG项目tools_01:Docker 极简实战
一份写给「只做开发、不做运维」的 AI 工程师的 Docker 学习笔记!总之就是一个字:好!!!Docker 拉取镜像时需要访问 Docker Hub(registry-1.docker.io),但国内网络访问不稳定,即使(●'◡'●)上网了,Docker Desktop 也不会自动使用系统代理。
deephub
2 天前
人工智能
·
大语言模型
·
embedding
·
rag
无 Embedding、无向量数据库的 RAG 方法:PageIndex 技术解析
PageIndex 是一种无向量、基于推理的检索增强生成(RAG)方法,无需 Embedding、分块或向量数据库即可从长文档中检索答案。
张小泡泡
2 天前
论文阅读
·
人工智能
·
rag
·
graphrag
Graph Retrieval-Augmented Generation: A Survey
近年来,检索增强生成(RAG)技术在无需重新训练的情况下,成功解决了大语言模型(LLM)面临的诸多难题。通过调用外部知识库,RAG 能够优化大语言模型的输出结果,有效缓解模型幻觉、领域专业知识匮乏以及信息过时等问题。
-许平安-
2 天前
c++
·
笔记
·
llm
·
rag
·
mcp
MCP项目笔记十二(RAG-MCP)
这套代码实现了一个完整的 RAG(检索增强生成)工具检索系统,核心职责是:给定用户的自然语言 Query,从一批已注册的工具中找出语义最相关的若干个,最终以 LLM Function Calling 格式返回。
deephub
3 天前
人工智能
·
python
·
大语言模型
·
向量检索
·
rag
从检索到回答:RAG 流水线中三个被忽视的故障点
RAG 流水线部署完毕、检索正常运行、LLM 按部就班地生成回答、用户也在持续收到响应,这一切看上去运转良好。但有一个问题大多数工程师从来不问:这些回答真的对吗?
Flying pigs~~
3 天前
数据库
·
redis
·
缓存
·
大模型
·
qa
·
rag
·
prompt提示词
RAG前身:基于mysql➕redis➕bm25的传统QA问答系统
本文将从一个完整的项目实战出发,详细讲解如何构建一个基于传统检索技术的智能问答系统。我们会逐行分析代码,深入理解每个模块的设计思想、实现细节和优化思路。
念念不忘 必有回响
3 天前
rag
·
切分
RAG 入门第二课:从 PDF 深度解析到智能入库全链路
在构建 RAG 系统时,我们常把精力花在调优大模型上,却忽略了最基础也最关键的一环——数据处理。俗话说“垃圾进,垃圾出”,如果文档读取乱码、切分支离破碎,再强大的模型也无法给出精准答案。
Flying pigs~~
3 天前
人工智能
·
agent
·
milvus
·
rag
·
智能体
·
检索增强生成
检索增强生成RAG项目tools_03:mysql➕redis➕milvus
前面我们介绍了Docker部署➕ollama➕logging➕bm25等RAG项目中各个必不可少的tools,本篇主要讲的是mysql➕redis➕milvus!!!
guslegend
3 天前
人工智能
·
大模型
·
faiss
·
rag
第9节:FAISS,HNSW还是BM25?如何选择最适合业务的向量检索引擎?如何选择最适合业务的向量检索引擎
RAG与Agent性能调优:第8节:打造可配置,可扩展的自动化预处理流水线Gitee地址:https://gitee.com/agiforgagaplus/OptiRAGAgent
发光的叮当猫
3 天前
人工智能
·
微调
·
rag
·
ai工程
AI工程可能会遇到的一些问题
1,检索质量太差,根本没有检索到正确内容原因:embedding不行,相似度算错,语义没对齐。query没有被改写,完全没有上下文,检索失败。
QC·Rex
4 天前
向量数据库
·
rag
·
相似度搜索
·
hnsw 算法
·
ai 基础设施
向量数据库架构与应用实战:从原理到生产部署
在传统的关系型数据库中,数据查询主要基于精确匹配或范围查询。例如:然而,在 AI 应用场景中,我们经常需要处理"语义相似性"查询:
deephub
4 天前
人工智能
·
大语言模型
·
知识库
·
rag
Karpathy的LLM Wiki:一种将RAG从解释器模式升级为编译器模式的架构
Andrej Karpathy在GitHub上发布了一份名为LLM Wiki的文档引起了巨大的关注,一派认为"这不就是多绕了几步的RAG",另一派已经打开编辑器着手搭建测试。
guslegend
4 天前
人工智能
·
大模型
·
rag
第8节:打造可配置,可扩展的自动化预处理流水线
RAG与Agent性能调优:第8节:打造可配置,可扩展的自动化预处理流水线Gitee地址:https://gitee.com/agiforgagaplus/OptiRAGAgent
guslegend
5 天前
人工智能
·
大模型
·
ocr
·
rag
第6节:OCR文本错漏频发?结合LLM纠错,让图像文本也能精确使用
RAG与Agent性能调优:6.OCR文本错漏频发?结合LLM纠错,让图像文本也能精确使用Gitee地址:https://gitee.com/agiforgagaplus/OptiRAGAgent