【AI赋能软件测试】6RAG知识库基础

Token = 大模型能读懂的最小"文字碎片"

不再按汉字/字符算,按模型拆分后的碎片计费、算长度。

  • 1 中文汉字 ≈ 1.3 个 Token

  • 1 英文单词 ≈ 1 个 Token

  • 1000 汉字 ≈ 1300 Token

  • 字符:我们肉眼数的字、标点、字母

  • Token :模型内部切割后的小块

    模型不会整字读,会拆偏旁、词根、词组碎片处理。

体验:阿里百炼平台->应用->侧栏知识库

https://bailian.console.aliyun.com/cn-beijing?spm=5176.12818093.console-base_product-drawer-right.dproducts-and-services-sfm.3be916d0HTrGdx#/home

RAG原理

绿色:数据的嵌入embedding

  • 文字性的相似性查询

    存文档进知识库、数据分块(图片转成文字->文字提取出来->再存进去->再分块)、拆分策略、

    常规数据库:文字存入数据库

    常规数据库:查询:全文检索(关键字匹配)

    大语言模型:查找:根据语义查找(相似性匹配)

    向量数据库:文字转成数字(向量)存入向量数据库

    embedding model本身也是一种大模型

  • 图片性的相似性查询

红色 :数据的召回(检索)

用户提问->嵌入模型先对用户问题进行向量转换->根据数字到向量数据库进行相似度查询->返回相关的块数据(top_k=20这个数大一些保证需要的答案在召回数据里、1表示最相似但不一定正确、足够大如果还不行引入模型重排)->把用户的问题+返回的所有数据(上下文)一起发送给大模型

大模型智能体:把用户问题拆分成很多子问题、多次查询,增大召回准确率7

还可以做混合检索(语义+全文检索)

知识图谱:构建文档之间的关系

加载:不同格式的文档加载器加载各种各样的数据

借助嵌入模型进行转换

使用嵌入模型的方式:

  • 在线服务商提供的api

  • 私有化自己部署

https://www.modelscope.cn/home

huggingface

企业用8b,自己用0.6b

嵌入模型一旦使用不能修改(如果换模型纬度不一样数据都作废)

运行模型的框架:

Ubuntu安装Ollama(服务器/虚拟机内存4G以上)

(1)在Linux终端粘贴命令

(2)下载模型

在Linux终端粘贴命令

bash 复制代码
ollama pull qwen3-embedding:0.6b

查看

bash 复制代码
ollama list

(3)修改配置支持ollama远程访问

bash 复制代码
vi
bash 复制代码
Environment="OLLAMA_HOST=0.0.0.0:11434"

(4)重启服务

bash 复制代码
sudo systemctl daemon-reload
sudo systemctl restart ollama

(5)放开端口(本机)

bash 复制代码
ufw allow 11434

(云服务器)到官网后台

(6)用另一台电脑访问 http://你的服务器IP:11434,能返回结果就成功了

后续:部署和使用RAG系统,开发MCP server对接用例生成系统

关注"用例采纳率"

相关推荐
一只齐刘海的猫7 分钟前
【Leetcode】找到字符串中所有字母异位词
算法·leetcode·职场和发展
Kobebryant-Manba33 分钟前
学习RNN(简洁实现)
人工智能·rnn·学习
知南x1 小时前
【DPDK例程学习】(4) l2fwd
学习·word
努力努力再努力FFF1 小时前
大学四年AI能力规划:从入门学习到简历表达
人工智能·学习
Litluecat1 小时前
配合多角色提示语3,学习AI漫剧(刚开始学)
人工智能·学习·ai·提示词·短剧·漫剧
三品吉他手会点灯2 小时前
STM32F103 学习笔记-24-I2C-读写EEPROM(第1节)-I2C物理层介绍
笔记·stm32·学习
文艺倾年2 小时前
【强化学习】强化学习基本概念,20W字总结(一)
人工智能·python·语言模型·自然语言处理·面试·职场和发展·大模型
MartinYeung52 小时前
[论文学习]大型语言模型中个人可识别资讯(PII)的机器遗忘技术:UnlearnPII 基准与 PERMU_tok 方法的深度分析
人工智能·学习·语言模型
fanged2 小时前
Linux内核学习21--V4L2学习3(应用)(TODO)
学习
凌波粒2 小时前
LeetCode--108.将有序数组转换为二叉搜索树(二叉树)
算法·leetcode·职场和发展