rag

molaifeng17 小时前
milvus·rag
告别大模型幻觉:深度解析 RAG 文档切割艺术与 Milvus 高性能实战在生成式 AI 的浪潮中,RAG(Retrieval-Augmented Generation,检索增强生成)已经成为了企业级大模型应用的“标配”。它像是在大模型(LLM)这个天才大脑旁边放了一座实时更新的图书馆,让模型能够突破预训练数据的时空限制,回答私有领域或最新发生的专业问题。
小汤圆不甜不要钱1 天前
人工智能·深度学习·机器学习·rag
「Datawhale」RAG技术全栈指南 Task 3概念 embedding是将真实世界中复杂、高维的数据对象转换为数学上易于处理的、低维、稠密的连续数值向量的技术。embedding的核心意义在于,它所构建的向量空间中,语义相似的对象得到的向量距离会更近,语义上不相关的对象向量距离会更远。 理解: embedding是将文本/图像等人类能看懂的数据转换成计算中可量化的数据。 如何衡量一个embedding模型的好坏,是看相近词的向量相似度是否更高,无关词的向量相似度更低。 如何度量相似度? - 余弦相似度/点积/欧氏距离 如何选择不同的度量方法? - 余
一个无名的炼丹师1 天前
python·pdf·大模型·多模态·rag
DeepSeek+LangGraph构建企业级多模态RAG:从PDF复杂解析到Agentic智能检索全流程实战摘要: 传统的文本RAG(检索增强生成)在面对包含复杂表格、图片和多栏排版的PDF文档时往往力不从心。本文将带你从零开始,基于 Unstructured + PaddleOCR 实现“结构解析重建法”,将复杂的PDF逆向转化为高质量的Markdown文档;并结合 DeepSeek 大模型与 LangGraph 智能体框架,构建一个具备自我修正能力的 Agentic RAG 引擎。本文包含完整的环境配置、核心代码实现及架构原理解析。
沛沛老爹1 天前
java·javascript·图像处理·人工智能·python·rag
从Web到AI:多模态Agent图像识别Skills开发实战——JavaScript+Python全栈图像处理方案图片来源网络,侵权联系删。作为Web开发者,我们熟悉<canvas>绘制图像、用FileReader处理上传文件、通过CSS滤镜实现视觉效果。当业务需求从"展示商品图片"升级为"识别图中商品瑕疵并生成质检报告",当用户交互从"点击按钮"进化为"圈出图片问题区域获取解决方案"——传统Web图像处理能力已触达天花板。某电商平台数据显示:集成图像识别Skills的Agent客服,商品咨询转化率提升38%;某工业App通过实时缺陷检测,设备故障响应速度缩短至2.3秒。
沛沛老爹1 天前
java·开发语言·前端·人工智能·llm·安全架构·rag
从Web到AI:Agent Skills安全架构实战——权限控制与数据保护的Java+Vue全栈方案图片来源网络,侵权联系删。作为Web开发者,我们熟悉的Spring Security、JWT令牌、RBAC权限模型,正在Agent Skills领域遭遇全新挑战。当某银行因Skills权限漏洞导致客户征信数据泄露,当某电商平台因未隔离的Agent内存引发越权访问——Skills安全不是AI专属课题,而是Web安全架构的维度升级。
沛沛老爹2 天前
java·开发语言·前端·vue.js·人工智能·rag·企业转型
从Web到AI:行业专属Agent Skills生态系统技术演进实战图片来源网络,侵权联系删。Skills生态系统相关文章从Web到AI:构建行业专属Skills生态系统的实战指南与未来展望
deephub2 天前
人工智能·深度学习·损失函数·信息检索·rag
RAG 检索模型如何学习:三种损失函数的机制解析Agent 系统发展得这么快那么检索模型还重要吗?RAG 本身都已经衍生出 Agentic RAG和 Self-RAG(这些更复杂的变体了。
沛沛老爹2 天前
java·前端·人工智能·安全·rag·web转型升级
Web开发者转型AI安全核心:Agent Skills沙盒环境与威胁缓解实战图片来源网络,侵权联系删。Skills安全架构系列从Web到AI:Agent Skills安全架构实战——权限控制与数据保护的Java+Vue全栈方案
沛沛老爹2 天前
java·人工智能·rag·企业转型·合规
Web开发者转型AI安全核心:Agent金融数据处理Skill合规架构实战图片来源网络,侵权联系删。Skills安全架构系列@[toc]在Web金融系统中,我们深谙数据合规的价值:HTTPS加密传输保障交易安全,Spring Security的RBAC模型控制数据访问权限,PCI DSS标准要求敏感字段脱敏存储。当Web开发者进入AI金融领域,Agent Skills面临更严峻挑战——处理个人征信、账户流水等敏感数据时,一次提示词注入攻击可能导致千万级数据泄露。
羞儿3 天前
设计模式·知识图谱·agent·rag·mcp·指导开发
Agent设计模式与工程化完成最关键的第一部分:定义系统的边界与核心逻辑。Smart Scholar Agent 旨在解决学术研究中的“信息过载”与“知识碎片化”问题。它不仅仅是一个阅读器,而是一个端到端的知识生产引擎,能自动将 PDF 转化为结构化知识、视觉洞察、对比表格以及动态演化的知识图谱。
沛沛老爹4 天前
java·前端·vue.js·人工智能·rag·企业转型
从Web到AI:多模态Agent Skills生态系统实战(Java+Vue构建跨模态智能体)图片来源网络,侵权联系删。Skills生态系统相关系列文章从Web到AI:构建行业专属Skills生态系统的实战指南与未来展望
MarsBighead4 天前
ai·postgresql·rag
PostgreSQL全文检索中文分词器配置与优化实践在构建RAG(检索增强生成)系统的过程中,提升检索效率与准确性是一个持续优化的课题。除了常见的嵌入向量检索外,结合全文检索技术能进一步改善系统表现。本文基于PostgreSQL数据库,分享中文全文检索分词器的配置、索引创建与使用实践,记录在真实场景中遇到的问题与解决方案。
laplace01235 天前
数据库·人工智能·笔记·agent·rag
第八章 agent记忆与检索 下检索增强生成(Retrieval-Augmented Generation,RAG)是一种结合了信息检索和文本生成的技术。它的核心思想是:在生成回答之前,先从外部知识库中检索相关信息,然后将检索到的信息作为上下文提供给大语言模型,从而生成更准确、更可靠的回答。
ThinkPet5 天前
java·人工智能·ai·大模型·rag·springai·mcp
【AI】大模型知识入门扫盲以及SpringAi快速入门大模型是基于海量数据训练的、参数量巨大的深度学习模型,核心能力是理解和生成人类语言,完成推理翻译代码编写等复杂任务。案例-chatgpt,千问,豆包,deepseek。
AI周红伟5 天前
大模型·微调·部署·rag·智能体·agent智能体
周红伟《DeepSeek企业大模型的企业级部署及优化和RAG知识库和Agent智能体构建的案例交付实操》——企业私有RAG知识库业务助手的构建课程背景大规模预训练模型已成为推动智能化转型的核心动力。从DeepSeek,Qwen, Yiyan 到各行业定制化大模型,越来越多的企业开始将“以大模型为中台”的技术架构融入产品与服务。
laplace01235 天前
人工智能·agent·rag
第八章 agent记忆与检索上第八章 记忆与检索 学习笔记 本章的主要目标是增加memory system和rag功能那为什么智能体需memory和rag (1)局限一:无状态导致的对话遗忘 上下文丢失:在长对话中,早期的重要信息可能会因为上下文窗口限制而丢失 个性化缺失:Agent无法记住用户的偏好、习惯或特定需求 学习能力受限:无法从过往的成功或失败经验中学习改进 一致性问题:在多轮对话中可能出现前后矛盾的回答
程序员:钧念6 天前
人工智能·python·深度学习·算法·transformer·rag
深度学习与强化学习的区别这是一个非常深刻的区别,触及了人工智能的两个不同维度:感知(Perception)与决策(Decision Making)。
云雾J视界6 天前
大数据·人工智能·api·知识库·rag·gemini
RAG 还是微调?用 Gemini API 打造企业私有知识库的落地路径在当今技术密集型企业中,一个被反复验证却长期被忽视的事实是:72% 的组织知识以非结构化形式存在——PDF 技术手册、Confluence 页面、Slack 讨论记录、会议纪要、客户工单……这些“沉默资产”构成了企业真正的智力资本,却因检索效率低下而长期沉睡。根据 Gartner 2025 年发布的《企业知识管理现状报告》,员工平均每周花费 3.5 小时搜寻信息,而在技术文档场景下,传统关键词搜索的准确率不足 40%。
TGITCIC6 天前
langchain·ai大模型·rag·ai agent·ai智能体·agent开发·大模型产品
langchain入门(五)- 用mongodb管理提示词以及以restful service暴露在 LLM 应用从原型走向产品化的过程中,一个常被低估但至关重要的环节是“提示词管理”。早期开发中,提示词往往直接硬编码在 Python 脚本里,看似方便,实则埋下隐患。一旦进入多环境部署、A/B 测试或多团队协作阶段,这种做法会迅速导致配置混乱、版本失控和调试困难。真正健壮的 LLM 应用,其核心竞争力往往不在于模型本身,而在于对提示词、参数和上下文的精细化控制能力。
TGITCIC6 天前
人工智能·rag·ai agent·图搜索·ai智能体·langgraph·graphrag
LangGraph:让AI学会“回头是岸”的智能体架构在大模型应用开发的早期,我们像工厂老板一样,把AI当作一条高效但死板的流水线:输入进来,经过A、B、C几个固定工位,最后吐出结果。这种DAG(有向无环图)模式确实快,可一旦任务复杂一点,比如需要反复试错、中途查资料、甚至“我刚才说错了”,这套系统就直接宕机。LangChain早期的Chain设计正是如此——线性、脆弱、没有“后悔药”。