10分钟构建本地RAG应用

准备工作

本地模型

模型分为两种:

1.专有模型:闭源模型

  1. OpenAI GPT4
  2. Cluade

优点:强大的商业支持

缺点:付费、数据的隐私

2.开源模型(学习阶段)

  • 微软:Phi
  • Meta:Llama
  • deepseek

不需要联网

安装Ollama

  • Ollama:模型平台,可以安装各种模型:Qwen、Deepseek、Llama...
  • Llama:模型(最新 Llama)
arduino 复制代码
ollama run <模型的名字>

本身是运行XX模型的意思,如果没有该模型,会先去下载。

启动模型后,ollama 会启动一个服务,坚听 11434 端口。

bash 复制代码
curl http://localhost:11434/api/tags   # 查看本地模型

本地的一个聊天机器人

回头RAG应用基于这个聊天机器人。

RAG基本的理论

大语言模型的缺陷:回答问题基于训练过的数据。

RAG:Retrieval-Augmented Generation,检索增强生成。

RAG 就是临时给大模型外挂一个知识库

整个 RAG 的架构如下:

1. 数据索引

Data Indexing

数据索引主要是做下面几件事情:

  1. 加载文档(你要外挂的知识库)

  2. 切分成一个一个 chunks(块)

  3. 转换为高维度向量

  4. 将结果存储到向量数据库

    这是一只小猫。

csharp 复制代码
[0.71, 0.32, -0.56, ....]

2. 数据查询

Query

复制代码
介绍一下香蕉手机。

首先会把这个 Query 也转换成向量的形式。(方便计算)

拿到这个 Query Embeding 之后,去向量数据库里面找和 Query Embeding 相关的内容,取出相关内容的向量(Vector Embedding),然后将:

markdown 复制代码
1. Vector Embedding
2. 用户的问题

一起交给大模型进行处理。

相关推荐
深念Y6 分钟前
Token 还没白菜价,我靠“AI 流水线”省token
ai·api·agent·开发·token·工程·词元
Old Uncle Tom10 小时前
Claude Code 记忆系统分析2
人工智能·ai·agent
小兵张健10 小时前
强程序员在 AI 时代的赚钱路径
程序员·openai
小安同学iter10 小时前
LangChain4j:非 Spring 系,AI For Java的另一条路
ai·langchain·agent·langchain4j·java+ai
维元码簿10 小时前
系列开篇 | Claude Code 源码架构概览:51万行代码的模块地图
ai·agent·claude code·ai coding
呆呆敲代码的小Y11 小时前
从LLM到Agent Skill:AI核心技术全拆解与系统化学习路线
人工智能·ai·llm·agent·优化·skill·mcp
DFCED12 小时前
突发!Sora 之父 Bill Peebles 离职:OpenAI 理想主义的又一次落幕
人工智能·大模型·agent·sora
胡志辉的博客13 小时前
多智能体协作,不是多开几个 Agent:从中介者模式看 OpenClaw 和 Hermes Agent
人工智能·设计模式·ai·agent·中介者模式·openclaw·herman
山顶夕景14 小时前
【Agent】构建Harness的六大组件
agent·智能体·skill
爱敲代码的小黄15 小时前
我重新梳理了一遍 RAG,终于明白它不只是接个向量库
后端·面试·agent