rag

王建文go6 小时前
人工智能·宠物·rag
RAG(宠物健康AI)公司目前的 AI 问诊模块,对于专业知识的回答还有待提高,直接调用 LLM,回复的问诊可能并不满意,所以需要使用 RAG 索引加强。
玄同76514 小时前
开发语言·人工智能·python·langchain·知识图谱·rag·智能体
LangChain 1.0 模型接口:多厂商集成与统一调用大语言模型 (LLM) 开发工程师 | 中国传媒大学 · 数字媒体技术(智能交互与游戏设计)CSDN · 个人主页 | GitHub · Follow
落霞的思绪17 小时前
java·spring·rag·springai
Spring AI Alibaba 集成 Redis 向量数据库实现 RAG 与记忆功能本文基于一个完整的 Spring Boot 项目示例,详细讲解如何使用 Spring AI Alibaba 框架集成 Redis 向量数据库,实现检索增强生成(RAG)和对话记忆功能。项目包含向量存储、文档加载、多模型配置、记忆管理等核心模块,适用于构建具备知识库检索和上下文记忆的 AI 应用。
玄同76520 小时前
人工智能·深度学习·自然语言处理·中间件·架构·langchain·rag
LangChain 1.0 框架全面解析:从架构到实践大语言模型 (LLM) 开发工程师 | 中国传媒大学 · 数字媒体技术(智能交互与游戏设计)CSDN · 个人主页 | GitHub · Follow
Java后端的Ai之路1 天前
人工智能·rag·rag系统·召回·rag调优
【RAG技术】- RAG系统调优手段之高效召回(通俗易懂附案例)在信息爆炸的时代,我们常常被海量数据淹没。如何从浩瀚的知识海洋中精准捞出我们想要的那一瓢水?这正是检索增强生成(Retrieval-Augmented Generation, RAG)技术的核心魅力。RAG就像一个超级图书馆管理员,它不仅能帮你找到书,还能根据书的内容为你总结答案。但如果这个管理员“召”回的书不对,那答案自然也就“生成”得不靠谱了。所以,今天我们就来聊聊RAG的“精准雷达”——高效召回策略,看看如何让你的RAG系统变成一个真正的“信息捕手”!
千桐科技1 天前
大模型·llm·知识图谱·知识库·rag·qknow·知识平台
qKnow 知识平台核心能力解析|第 03 期:结构化抽取能力全流程介绍在知识驱动应用越来越重要的今天,如何把分散、杂乱的数据,快速转化为“可用的知识”,成为很多企业和团队绕不开的问题。
OPEN-Source1 天前
人工智能·性能优化·rag
大模型实战:大模型推理性能优化与成本控制实战在前面几篇里,我们把企业大模型应用从 0 搭到了「能跑生产」:但只要一上线,技术团队和老板都很快会问两个问题:
早点睡觉好了1 天前
算法·ai·rag
重排序 (Re-ranking) 算法详解在传统的 RAG 流程中,向量检索(Retriever)通常返回 Top K(例如 5 个)文档给 LLM。然而:
laplace01232 天前
数据库·人工智能·笔记·学习·agent·rag
Claude Code 逆向工程报告 笔记(学习记录)Claude Code 用 “分层注入 + 可选上下文(system-reminder)+ 按需能力加载(skills)+ 隔离执行(sub-agent)” 把上下文工程系统化:既解决“上下文太长/指令过载”的工程问题,也试图把 prompt injection 风险隔离在可控边界内。 原文分析见https://www.xiaohongshu.com/explore/697db619000000002103f9d8?app_platform=android&ignoreEngage=true&app_ve
沛沛老爹2 天前
人工智能·agent·适配器模式·rag·企业转型·skills
跨平台Agent Skills开发:适配器模式赋能提示词优化与多AI应用无缝集成图片来源网络,侵权联系删。跨平台Skills开发系列“我的天气查询Skill在OpenAI上完美运行,迁移到通义千问却因提示词格式崩溃,Claude又要求XML包裹——难道每个平台都要维护一套代码?”
玄同7652 天前
数据库·人工智能·知识图谱·milvus·知识库·向量数据库·rag
数据库全解析:从关系型到向量数据库,LLM 开发中的选型指南大语言模型 (LLM) 开发工程师 | 中国传媒大学 · 数字媒体技术(智能交互与游戏设计)CSDN · 个人主页 | GitHub · Follow
烙印6012 天前
ai·agent·rag
RAG智能体深度解析(一)RAG是一种结合了信息检索和文本生成的AI技术。它解决了大型语言模型(LLM)的一个关键限制:知识截止日期和领域专业知识的缺乏。
北京地铁1号线2 天前
自动化·rag·评测·ragas·trulens
5.1 RAG系统的自动化评测目录一、RAG评估的重要性与挑战为什么需要专门评估RAG?评估的四大挑战二、核心评估指标详解1. Faithfulness(忠实度/真实性)
gentle coder2 天前
大模型·agent·rag
【RAG】大模型RAG开发通⽤的基础⼤模型存在一些问题:1.LLM的知识不是实时的,模型训练好后不具备自动更新知识的能力,会导致部分信息滞后。
无名修道院2 天前
人工智能·向量数据库·rag·ai大模型应用开发
AI大模型应用开发-RAG 基础:向量数据库(FAISS/Milvus)、文本拆分、相似性搜索(“让模型查资料再回答”)RAG = Retrieval-Augmented Generation检索增强生成,核心逻辑是「让大模型先查 “专属资料”,再基于资料回答问题」。
CCPC不拿奖不改名3 天前
人工智能·python·langchain·知识库·改行学it·rag·向量库
RAG基础:基于LangChain 的文本分割实战+文本分块适应上下文窗口: 这是最主要的原因。将长文档分割成小块,可以让我们在处理时只关注与用户问题最相关的部分。
gentle coder3 天前
langchain·llm·rag
【langchain】AI应用开发框架LangChain 由 Harrison Chase 创建于2022年10月,它是围绕LLMs(大语言模型)建立的一个框架。
OPEN-Source3 天前
人工智能·langchain·企业微信·rag
大模型实战:把 LangChain / LlamaIndex 工作流接入监控与告警体系如何把基于 LangChain / LlamaIndex 的智能工作流,接入企业监控与告警体系。在前五篇里,我们已经把企业智能助手一路从「能答题」进化到「能跑业务流程」:
玄同7653 天前
人工智能·中间件·langchain·知识图谱·fastapi·知识库·rag
LangChain v1.0+ 与 FastAPI 中间件深度解析:从概念到实战【个人主页:玄同765】大语言模型(LLM)开发工程师|中国传媒大学·数字媒体技术(智能交互与游戏设计)
库里不会投三分3 天前
spring cloud·java面试·rag·spring ai·ai招聘·音视频架构
谢飞机面试记:从JVM到Spring AI的3轮灵魂拷问(音视频+AI招聘双场景)面试官:张工,某一线大厂音视频中台&AI招聘平台双线技术负责人 求职者:谢飞机,三年Java经验,简历写着「精通Spring全家桶,熟悉AI Agent」,实际靠《Java编程思想》前3章撑场子