技术栈
rag
xzzd_jokelin
13 小时前
java
·
人工智能
·
spring
·
ai
·
大模型
·
rag
·
deepseek
Spring AI 接入 DeepSeek:开启智能应用的新篇章
DeepSeek 是由国内顶尖 AI 团队「深度求索」开发的一款多模态大模型,具备数学推理、代码生成等高阶能力,被誉为“AI界的六边形战士”。其 R1 版本采用“思维链”技术,能完整展示推理过程,在复杂任务中表现尤为出色,甚至在部分场景下可与 OpenAI 的顶级模型媲美。DeepSeek 提供了 OpenAI 兼容模式,使得开发者可以通过简单的配置将其集成到现有系统中。
sp42a
1 天前
ai
·
fastgpt
·
rag
Windows 上源码安装 FastGPT
FastGPT 是一个强大的 AI RAG 平台,值得我们去学习了解。与常见的 Python 体系不同,Fast GPT 采用 Node.js/Next.js 平台(对于广大 JS 开发者或前端开发者比较亲切友好),安装或部署比较简单。虽然一般情况下推荐简单的 Docker 方式部署。但是这里采用源码构建的方式进行部署,以便更好地深入了解 FastGPT,同时在生产环境中,也推荐使用源码编译的方式部署。
背太阳的牧羊人
1 天前
开发语言
·
人工智能
·
python
·
langchain
·
rag
RAG检索中使用一个 长上下文重排序器(Long Context Reorder) 对检索到的文档进行进一步的处理和排序,优化输出顺序
使用一个长上下文重排序器对检索到的文档进行进一步的处理和排序,优化输出顺序。 优化前的检索内容,顺序混乱:
浮华落定
2 天前
知识库
·
rag
·
ollama
·
ragflow
RagFlow+Ollama 构建RAG私有化知识库
在日常工作和学习中,我们时常会面对大量的PDF、Word、Excel等文档,需要从中查找特定的信息或内容。然而,传统的Ctrl+F搜索方式在面对海量文档或复杂格式时,往往效率低下,令人头疼。如果使用MaxKb 工具,它将彻底改变你处理文档的方式。
小白顶呱呱
4 天前
笔记
·
大模型
·
prompt
·
rag
·
大模型微调
图解【提示工程 VS 微调 VS RAG、全量微调 VS LoRA微调、TopK VS TopP】截图笔记
RAG实战中难以解决的问题点:微软提出的GraphRAG项目备受关注。该项目的主要目的是通过改进信息检索和整理的方式,提升企业知识库的实用性和响应速度。GraphRAG的核心理念在于提前整理和构建知识图谱,并将信息关联起来,以便于快速回答具体或宏观的问题。
大龄码农有梦想
6 天前
人工智能
·
spring boot
·
spring
·
milvus
·
知识库
·
rag
·
spring ai
Springboot集成Spring AI和Milvus,验证RAG构建过程
在当今信息爆炸的时代,如何高效地管理和利用海量的知识数据成为了企业和开发者面临的重大挑战。基于AI的大模型和检索增强生成(RAG, Retrieval-Augmented Generation)技术为这一难题提供了全新的解决方案。通过结合向量数据库、Embedding技术以及先进的大语言模型,我们可以构建一个强大的本地知识库系统,并实现高效的检索增强生成流程。
Rickie
7 天前
langchain
·
rag
·
deepseek
DeepSeek-V3 解读:优化效率与规模
Andy_shenzl
8 天前
rag
·
graphrag
graphRAG的原理及代码实战(2)基本原理介绍(中)
graphRAG-结果解读前文中,graphRAG项目index索引建立完成后,会生成7个parquet文件。 为什么用 Parquet 格式保存知识图谱?
uncle_ll
9 天前
大模型
·
llm
·
llama
·
qwen
·
rag
基于 llama-index与Qwen大模型实现RAG
LlamaIndex和Langchain都是比较成熟的RAG和Agent框架,这里基于llama实现RAG框架,大模型选用阿里的开源模型Qwen大模型。可以实现Qwen2.5 与外部数据(例如文档、网页等)的连接,利用 LlamaIndex 与 Qwen2.5 快速部署检索增强生成(RAG)技术。
伊织code
9 天前
api
·
配置
·
workflow
·
知识库
·
dify
·
rag
·
问答
Dify - 创建 RAG Workflow 及 Restful HTTP 请求
本文参考视频教程: 五里墩茶社 : Dify聊天工作流 | 基于私有知识库和搜索引擎,构建高质量RAG聊天应用 https://www.bilibili.com/video/BV19E4m1R7c2/
浮华落定
11 天前
rag
·
llama3
·
maxkb
·
deepseek
[开源]MaxKb+Ollama 构建RAG私有化知识库
MaxKB 是一款基于 LLM 大语言模型的知识库问答系统。MaxKB = Max Knowledge Base,旨在成为企业的最强大脑。
大模型之路
16 天前
rag
·
检索增强生成
·
cag
探索从传统检索增强生成(RAG)到缓存增强生成(CAG)的转变
在人工智能快速发展的当下,大型语言模型(LLMs)已成为众多应用的核心技术。检索增强生成(RAG)(RAG 系统从 POC 到生产应用:全面解析与实践指南)和缓存增强生成(CAG)(Cache-Augmented Generation(CAG):一种更快、更简单的RAG替代方案)作为提升 LLMs 性能的关键技术,备受关注。这两种技术各自具有独特的优势与局限,深入探究从 RAG 到 CAG 的转变,对于理解人工智能技术的演进、优化应用开发具有重要意义。
程序喵;
23 天前
论文阅读
·
人工智能
·
语言模型
·
自然语言处理
·
rag
Retrieval-Augmented Generation for Large Language Models: A Survey——(1)Overview
Naive RAGAdvanced RAGModular RAGRAG技术在推理阶段, 预训练阶段, 微调阶段都可以增强
大模型之路
1 个月前
llm
·
rag
·
检索增强生成
·
llm幻觉
·
hallucination
LLM幻觉(Hallucination)缓解技术综述与展望
LLMs 中的幻觉问题(LLM 幻觉:现象剖析、影响与应对策略)对其可靠性与实用性构成了严重威胁。幻觉现象表现为模型生成的内容与事实严重不符,在医疗、金融、法律等对准确性要求极高的关键领域,可能引发误导性后果,因此,探寻有效的幻觉缓解技术成为当前人工智能研究的关键任务。
uncle_ll
1 个月前
gpt
·
chatgpt
·
langchain
·
llm
·
rag
ChatGPT大模型极简应用开发-CH5-使用 LangChain 框架和插件增强 LLM 的功能
LangChain 是专用于开发 LLM 驱动型应用程序的框架。该框架还提供了许多额外的功能。使用以下命令可以快速、简便地安装 LangChain
AI明说
1 个月前
大数据
·
人工智能
·
大模型
·
rag
大模型开发 | RAG在实际开发中可能遇到的坑
近年来,大语言模型 (LLM) 的飞速发展令人瞩目,它们在各个领域展现出强大的应用潜力。然而,LLM 也存在一些固有的局限性,例如知识更新滞后、信息编造 (幻觉) 等问题。为了克服这些挑战,检索增强生成 (Retrieval-Augmented Generation, 简称 RAG) 技术应运而生,它将 LLM 与外部知识检索相结合,为生成内容提供更丰富、更准确的上下文信息,从而显著提升了 LLM 的性能和可靠性。
健忘的派大星
1 个月前
人工智能
·
ai
·
语言模型
·
llm
·
milvus
·
agi
·
rag
【AI大模型】根据官方案例使用milvus向量数据库打造问答RAG系统
“ 向量数据库是RAG技术的重要底座之一 ”关于RAG和向量数据库的基础知识这里就不再做介绍了,不懂的可以翻看之前的文章。
ZHOU_WUYI
1 个月前
人工智能
·
rag
lightrag源码 : Generate chunks from document
哥不是小萝莉
1 个月前
rag
提升大语言模型的三大策略
随着大语言模型(LLMs)在技术和应用上的不断发展,它们已经深刻地改变了我们与计算机的互动方式。从文本生成到语言理解,LLMs的应用几乎涵盖了各个行业。然而,尽管这些模型已展现出令人印象深刻的能力,如何将它们真正适配到自己特定的业务需求中,仍然是一个复杂且充满挑战的任务。