【机器学习】FastGPT 知识库搜索测试功能解析

本文以 FastGPT 知识库的搜索测试功能为入口,分析 FastGPT 的知识检索流程。

一、搜索功能介绍

1.1 整体介绍

搜索测试功能包含三种类型:语义检索、全文检索、混合检索。

**语义检索:**使用向量进行文本相关性查询,即调用向量数据库根据向量的相似性检索;

**全文检索:**使用传统的全文检索,适合查找一些关键词和主调语特殊的数据;

**混合检索:**使用向量检素与全文检素的综合结果返回,使用RRF算法进行排序。

默认情况下使用语义检索,如下所示。

搜索测试前可以根据"知识库搜索配置"进行相关参数的配置,例如:搜索模式、搜索过滤、问题优化等。

1.2 语义检索

本文以语义检索为切入点进行介绍。

依次进入知识库 -> 已创建知识库或新建知识库 -> 搜索测试,如下所示。

可以在测试框内搜索内容,测试当前知识库检索情况,检索完成会显示测试结果,如下所示。

二、主要流程

主要流程分为两部分。

(1)searchTest.ts 文件中 handler 函数负责访问限制的处理,例如:知识库读取权限、Token 的使用量计算等。

(2)controller.ts 文件中 searchDatasetData 函数负责相似向量的检索。

下一篇文章对具体的代码进行讲解。

1\] [FastGPT源码深度剖析:混合检索及语料召回逻辑 - 技术栈](https://jishuzhan.net/article/1772909020735082497 "FastGPT源码深度剖析:混合检索及语料召回逻辑 - 技术栈")

相关推荐
coder_pig1 小时前
🤔 试试 OpenAI 的最强编程模型 "GPT-5-Codex"?
chatgpt·openai·claude
CoderJia程序员甲21 小时前
GitHub 热榜项目 - 日榜(2025-09-13)
ai·开源·大模型·github·ai教程
齐杰拉1 天前
源码精读:拆解 ChatGPT 打字机效果背后的数据流水线
前端·chatgpt
@鱼香肉丝没有鱼1 天前
分布式推理与量化部署
ai·大模型·推理部署
DogDaoDao2 天前
神经网络稀疏化设计构架方法和原理深度解析
人工智能·pytorch·深度学习·神经网络·大模型·剪枝·网络稀疏
车骑2 天前
一个支持国外技术聚合翻译自动化的开源脚本
大模型·github
吏部侍郎2 天前
腾讯终于对Claude code下手了?我拿它跑完一个真实项目,结果有点意外…
大模型·ai编程
居7然2 天前
解锁AI智能体:上下文工程如何成为架构落地的“魔法钥匙”
人工智能·架构·大模型·智能体·上下文工程
mit6.8242 天前
[code-review] 日志机制 | `LOG_LEVEL`
人工智能·chatgpt·代码复审
Orange_sparkle2 天前
解决Dify中接入xinference模型无法开关思考模式和使用function calling的问题
人工智能·深度学习·语言模型·chatgpt