anythingLLM和deepseek4j和milvus组合建立RAG知识库

1、deepseek本地化部署使用 ollama

下载模型

Tags · bge-m3

html 复制代码
bge-m3:latest      
deepseek-r1:32b    
deepseek-r1:8b     

2、安装好向量数据库 milvus

docker安装milvus单机版-CSDN博客

3、安装 anythingLLM

AnythingLLM | The all-in-one AI application for everyone

官网下载很慢,网盘地址

通过网盘分享的文件:AnythingLLMDesktop.exe

链接: https://pan.baidu.com/s/1YfNKhYNBO1t8ULuK00E5yQ?pwd=gi2n 提取码: gi2n

4、anything 配置

第一步新建工作区

第二步 工作区配置 聊天配置

第三步 向量数据库配置

第四步 Embedding模型配置

第五步 喂数据

进入 milvus的管理界面可以看到 anything创建的向量库

第六步 在代码中使用

java 复制代码
    /**
     * RAG知识库接口
     * @param prompt
     * @return
     */
    @GetMapping(value = "/rag/chat", produces = MediaType.TEXT_EVENT_STREAM_VALUE)
    public Flux<ChatCompletionResponse> ragchat(String prompt) {

        List<Float> floatList = embeddingClient.embed(prompt);

        SearchReq searchReq = SearchReq.builder()
                .collectionName("anythingllm_test01")
                .data(Collections.singletonList(new FloatVec(floatList)))
//                metadata  text   deepseek4j_test
                .outputFields(Collections.singletonList("metadata"))
                .topK(3)
                .build();

        SearchResp searchResp = milvusClientV2.search(searchReq);

        List<String> resultList = new ArrayList<>();
        List<List<SearchResp.SearchResult>> searchResults = searchResp.getSearchResults();
        for (List<SearchResp.SearchResult> results : searchResults) {
            System.out.println("TopK results:");
            for (SearchResp.SearchResult result : results) {
                resultList.add(result.getEntity().get("metadata").toString());
            }
        }


        ChatCompletionRequest request = ChatCompletionRequest.builder()
                // 根据渠道模型名称动态修改这个参数
                .model("deepseek-r1:32b")
                .addUserMessage(String.format("你要根据用户输入的问题:%s \n \n 参考如下内容: %s  \n\n 整理处理最终结果", prompt, resultList)).build();

        return deepSeekClient.chatFluxCompletion(request);
    }

deepseek 调试 调试效果如下

deepseek私有化RAG思路

ollama 运行deepseek模型和向量化模型bge-m3,anything 实现喂数据到向量化数据库milvus,deepseek4j结合便可以实现RAG私有化

相关推荐
linweidong13 天前
如何设计和实施高效的向量化数据检索解决方案
人工智能·机器学习·大模型·agent·milvus·faiss·向量索引
Zilliz Planet14 天前
Milvus × 联想:向量数据库如何让制造业库存周转率提升10%
milvus
AIGC包拥它14 天前
检索召回率优化探究二:基于 LangChain 0.3集成 Milvus 2.5向量数据库构建的智能问答系统
人工智能·python·langchain·软件工程·个人开发·milvus
zhurui_xiaozhuzaizai14 天前
多向量检索:lanchain,dashvector,milvus,vestorsearch,MUVERA
人工智能·算法·机器学习·全文检索·milvus
Blessed_Li17 天前
【dify+milvus避坑指南】将向量库milvus集成给dify作为知识库
docker·ai·llm·milvus·dify
TGITCIC18 天前
还在使用Milvus向量库?2025-AI智能体选型架构防坑指南
milvus·向量数据库·ai agent·ai智能体·qdrant·rag增强检索
超龄超能程序猿19 天前
图片查重从设计到实现(5)Milvus可视化工具
python·milvus
qq_1780570720 天前
基于Milvus和BGE-VL模型实现以图搜图
milvus
风筝超冷21 天前
【Milvus合集】1.Milvus 的核心概念(collection、field、index、partition、segment)
人工智能·机器学习·milvus
超龄超能程序猿23 天前
图片查重从设计到实现(2)Milvus安装准备etcd介绍、应用场景及Docker安装配置
docker·etcd·milvus