rag

一包烟电脑面前做一天6 天前
.net·onnx·rag·文本向量化·本地大模型·qdrant
.Net + Qdrant 使用Microsoft.ML.OnnxRuntime调用本地大模型实现文本向量化,实现简单RAG本文使用.Net + 向量数据库Qdrant,实现使用本地大模型(Onnx)实现简单RAG,代码仅实现基本演示功能。
精致先生11 天前
人工智能·大模型·rag
RAG(检索增强生成)先通过信息 检索模块 从外部知识库(如数据库、文档、网页等)中获取相关的上下文信息,然后再将这些信息与原始输入一起传递给生成模型,生成更具上下文关联的回复。
GEM的左耳返11 天前
prompt工程·向量数据库·java面试·rag·ai应用·spring ai
Java AI面试实战:Spring AI与RAG技术落地面试官:谢飞机同学,今天我们聚焦Java AI应用开发,重点考察Spring AI和RAG技术栈。 谢飞机:(兴奋地)面试官好!我可是AI达人!ChatGPT、Midjourney我天天用,Spring AI这新框架我也研究过!
在未来等你11 天前
nlp·rag·retrieval-augmented generation·prompt engineering·context management
RAG实战指南 Day 24:上下文构建与提示工程欢迎来到"RAG实战指南"系列的第24天!今天我们将深入探讨RAG系统中至关重要的上下文构建与提示工程技术。在检索增强生成系统中,如何有效地组织检索到的文档片段,并将其转化为适合大语言模型(LLM)处理的提示,直接决定了最终生成结果的质量。本文将系统讲解上下文构建的最佳实践和高级提示工程技术,帮助您构建更精准、更可靠的RAG应用。
deephub12 天前
人工智能·深度学习·神经网络·langchain·大语言模型·rag
AI代理性能提升实战:LangChain+LangGraph内存管理与上下文优化完整指南在AI代理系统的开发过程中,上下文工程已成为决定系统性能的关键技术。上下文工程本质上是在为AI系统分配任务之前建立合适的执行环境,这个环境需要包含明确的行为指令(如配置AI充当专业的预算旅行顾问)、来自数据库、文档或实时数据源的有用信息访问权限、对历史对话的记忆能力以避免信息重复或遗忘、可供AI调用的工具集(计算器、搜索引擎等功能组件),以及用户的个性化信息(偏好设置、地理位置等关键细节)。
真就死难12 天前
人工智能·机器学习·rag
Rerank 模型的其中两种路径:BERT 相似度与 CoT 推理在构建高性能的问答系统或检索增强生成(RAG)架构时,Rerank(重排序)模块是信息检索质量的关键环节。它决定了哪些文档将最终送入大模型生成答案,因此直接影响回答的准确性与可用性。
缘友一世13 天前
rag·langgraph
ReAct Agent(LangGraph实现)================================ Human Message =================================
会写代码的斯皮尔伯格14 天前
openai·微服务架构·java面试·rag·ollama·spring ai·spring boot 3
Spring Boot 3整合Spring AI实战:9轮面试对话解析AI应用开发周先生:cc,先聊聊Spring AI的基础配置吧。如何在Spring Boot 3项目中集成Ollama?
许愿与你永世安宁15 天前
数据库·人工智能·gpt·oracle·llama·rag
RAG(检索增强生成)里的文档管理RAG(检索增强生成)是结合检索与生成式 AI 的技术框架。核心逻辑是先从外部知识库精准检索相关信息,再将其作为上下文输入大模型生成回答。技术上依赖检索引擎(如向量数据库、BM25)、大语言模型(如 GPT、LLaMA)及数据预处理技术。通过检索增强,解决大模型知识滞后、幻觉问题,提升回答准确性。应用广泛,涵盖智能客服、医疗问答、法律检索、教育辅导等场景,能基于特定领域知识提供精准、可控的生成内容。
数据饕餮16 天前
人工智能·python·大模型·rag
AI大模型打造金融智能信审助手04.七大金融监管相关政策银行作为金融体系的重要组成部分,受到一系列严格的金融监管政策的约束和规范,以确保金融市场的稳定、公平和透明。以下是一些常见的银行金融监管政策:
胡耀超17 天前
人工智能·深度学习·语言模型·自然语言处理·大模型·提示词·rag
大语言模型任务分解与汇总:从认知瓶颈到系统化解决方案设想这样一个场景:你要求GPT-4帮你完成一份包含市场调研、竞品分析、财务预测和战略规划的商业计划书。即使是最先进的大模型,面对这样的复杂任务也会"力不从心"。这并非模型能力不足,而是触及了当前大语言模型的根本性限制。
AI风老师18 天前
ai·dify·rag·研报
4、ubuntu | dify创建知识库 | 上市公司个股研报知识库创建一个知识库并上传相关文档主要涉及以下五个关键步骤:创建知识库:首先,需要创建一个新的知识库。这可以通过上传本地文件、从在线资源导入数据或者直接创建一个空的知识库来实现。
linmoo198620 天前
人工智能·spring·etl·rag·springai·documentreader
Spring AI 系列之十四 - RAG-ETL之一之前做个几个大模型的应用,都是使用Python语言,后来有一个项目使用了Java,并使用了Spring AI框架。随着Spring AI不断地完善,最近它发布了1.0正式版,意味着它已经能很好的作为企业级生产环境的使用。对于Java开发者来说真是一个福音,其功能已经能满足基于大模型开发企业级应用。借着这次机会,给大家分享一下Spring AI框架。
linmoo198620 天前
人工智能·spring·etl·transformers·rag·springai
Spring AI 系列之十五 - RAG-ETL之二之前做个几个大模型的应用,都是使用Python语言,后来有一个项目使用了Java,并使用了Spring AI框架。随着Spring AI不断地完善,最近它发布了1.0正式版,意味着它已经能很好的作为企业级生产环境的使用。对于Java开发者来说真是一个福音,其功能已经能满足基于大模型开发企业级应用。借着这次机会,给大家分享一下Spring AI框架。
dundunmm22 天前
论文阅读·大模型·llm·rag·检索增强生成·评估标准
【论文阅读】A Survey on Knowledge-Oriented Retrieval-Augmented Generation(4)代码地址:GitHub - USTCAGI/CRAG-in-KDD-Cup2024【论文阅读】A Survey on Knowledge-Oriented Retrieval-Augmented Generation(1)-CSDN博客
Blessed_Li22 天前
llm·rag·ollama·graphrag
Linux系统安装部署GraphRAG完全指南GraphRAG(Graph-based Retrieval-Augmented Generation)是微软开源的新一代知识图谱增强型检索生成技术,它通过构建实体关系网络来提升传统RAG的全局理解能力。与传统基于文本块的RAG不同,GraphRAG能够:
PengShuaiD525 天前
人工智能·ai·rag
什么是RAG(Retrieval-Augmented Generation)?一文读懂检索增强生成RAG是一种结合文档检索(Retrieval)与语言模型生成(Generation)的技术,它的核心思想是:先查资料,再作答。
胡耀超25 天前
运维·docker·容器·大模型·知识图谱·rag·ollama
GraphRAG Docker化部署,接入本地Ollama完整技术指南:从零基础到生产部署的系统性知识体系相关推荐:Umi-OCR 的 Docker安装(win制作镜像,Linux(Ubuntu Server 22.04)离线部署)
Baihai IDP1 个月前
人工智能·ai·系统架构·llm·agent·rag·白海科技
AI 系统架构的演进:LLM → RAG → AI Workflow → AI Agent编者按: 当前 AI 系统建设中的一大痛点是:盲目追求先进技术而忽视业务实际需求,导致系统过度复杂、成本高昂、可靠性差。许多团队在 Agent 热潮中迷失方向,不知道何时该用简单的 LLM,何时需要 RAG,什么场景下才真正需要智能体。
G.E.N.1 个月前
大数据·人工智能·深度学习·神经网络·算法·llm·rag
开源!RAG竞技场(2):标准RAG算法本项目已开源:地址:https://github.com/ZehaoJia1024/RAG-Arena