【AI赋能软件测试】6RAG知识库基础

Token = 大模型能读懂的最小"文字碎片"

不再按汉字/字符算,按模型拆分后的碎片计费、算长度。

  • 1 中文汉字 ≈ 1.3 个 Token

  • 1 英文单词 ≈ 1 个 Token

  • 1000 汉字 ≈ 1300 Token

  • 字符:我们肉眼数的字、标点、字母

  • Token :模型内部切割后的小块

    模型不会整字读,会拆偏旁、词根、词组碎片处理。

体验:阿里百炼平台->应用->侧栏知识库

https://bailian.console.aliyun.com/cn-beijing?spm=5176.12818093.console-base_product-drawer-right.dproducts-and-services-sfm.3be916d0HTrGdx#/home

RAG原理

绿色:数据的嵌入embedding

  • 文字性的相似性查询

    存文档进知识库、数据分块(图片转成文字->文字提取出来->再存进去->再分块)、拆分策略、

    常规数据库:文字存入数据库

    常规数据库:查询:全文检索(关键字匹配)

    大语言模型:查找:根据语义查找(相似性匹配)

    向量数据库:文字转成数字(向量)存入向量数据库

    embedding model本身也是一种大模型

  • 图片性的相似性查询

红色 :数据的召回(检索)

用户提问->嵌入模型先对用户问题进行向量转换->根据数字到向量数据库进行相似度查询->返回相关的块数据(top_k=20这个数大一些保证需要的答案在召回数据里、1表示最相似但不一定正确、足够大如果还不行引入模型重排)->把用户的问题+返回的所有数据(上下文)一起发送给大模型

大模型智能体:把用户问题拆分成很多子问题、多次查询,增大召回准确率7

还可以做混合检索(语义+全文检索)

知识图谱:构建文档之间的关系

加载:不同格式的文档加载器加载各种各样的数据

借助嵌入模型进行转换

使用嵌入模型的方式:

  • 在线服务商提供的api

  • 私有化自己部署

https://www.modelscope.cn/home

huggingface

企业用8b,自己用0.6b

嵌入模型一旦使用不能修改(如果换模型纬度不一样数据都作废)

运行模型的框架:

Ubuntu安装Ollama(服务器/虚拟机内存4G以上)

(1)在Linux终端粘贴命令

(2)下载模型

在Linux终端粘贴命令

bash 复制代码
ollama pull qwen3-embedding:0.6b

查看

bash 复制代码
ollama list

(3)修改配置支持ollama远程访问

bash 复制代码
vi
bash 复制代码
Environment="OLLAMA_HOST=0.0.0.0:11434"

(4)重启服务

bash 复制代码
sudo systemctl daemon-reload
sudo systemctl restart ollama

(5)放开端口(本机)

bash 复制代码
ufw allow 11434

(云服务器)到官网后台

(6)用另一台电脑访问 http://你的服务器IP:11434,能返回结果就成功了

后续:部署和使用RAG系统,开发MCP server对接用例生成系统

关注"用例采纳率"

相关推荐
Keep Running *12 小时前
Hermes_学习笔记
笔记·学习
z2005093012 小时前
【linux学习】进程的概念和在linux系统下的基本实现情况01
linux·网络·学习
EntyIU12 小时前
Python学习笔记
笔记·python·学习
魔法阵维护师12 小时前
从零开发游戏需要学习的c#模块,第二十四章(场景管理 —— 标题、游戏、结束画面)
学习·游戏·c#
wuxinyan12312 小时前
工业级大模型学习之路025:问题解决-检索质量全为0
人工智能·python·学习·langchain
happymaker062612 小时前
SpringBoot学习日记——DAY05(SpringBoot整合MyBatis-plus实现增删改查)
spring boot·学习·mybatis
吃好睡好便好12 小时前
用直接输入的方式创建矩阵
开发语言·人工智能·学习·线性代数·算法·matlab·矩阵
秋雨梧桐叶落莳12 小时前
iOS——UIStackView学习
学习·macos·ios·objective-c·cocoa
z2005093013 小时前
今日算法(二叉搜索树)
学习·leetcode