faiss

Muyuan19981 天前
人工智能·python·重构·django·fastapi·faiss
31.Cursor 初体验:用 AI Agent 给 PaperPilot 做一次最小工程重构最近在准备投入 AI 应用工程 / RAG / Agent / Python 后端方向的工作,发现 AI Coding 工具已经逐渐成为工程师日常开发的一部分。之前项目主要在 PyCharm 中开发,这次尝试用 Cursor 打开自己的 PaperPilot 项目,体验一次“让 AI 读代码、提计划、执行小改动、人工审查”的开发流程。
Muyuan19982 天前
fastapi·milvus·faiss
29.从 FAISS 到 Milvus:给我的 RAG Agent 项目加一层可替换的向量检索后端最近准备入职 AI Agent 项目组,公司技术文档中提到 AI 核心服务使用 FastAPI,业务后台使用 SpringBoot,数据层包括 MySQL、Redis 和 Milvus。
qq_283720057 天前
数据库·langchain·faiss
LangChain+FAISS 向量数据库搭建轻量化 RAG 应用📝 本章学习目标:本章聚焦企业轻量化落地,帮助读者快速掌握基于 LangChain+FAISS 的私有化 RAG 开发流程。通过本章学习,你将从零搭建一套无需 GPU、无外网依赖、纯本地运行、代码极简、可直接上线的轻量化 RAG 应用。
qq_2837200515 天前
faiss
纯本地 RAG 系统部署详细教程:DeepSeek+BGE+FAISS本次纯本地离线 RAG 系统完整部署,严格遵循环境搭建→依赖安装→本地模型离线下载→项目文件配置→PDF 知识库准备→向量库构建→本地大模型加载→RAG 问答逻辑调试→项目运行测试→问题优化排错十大标准化流程,全程断网可用、无云端 API 调用、无需密钥授权、全程屏蔽运行警告。整体部署逻辑由浅入深、层层递进:先搭建隔离独立的 Python 虚拟运行环境,规避多项目依赖冲突;再批量安装 PDF 解析、文本分割、向量数据库、大模型推理全套依赖库;接着手动下载 DeepSeek 大语言模型、BGE 中文嵌入模型
狐狐生风17 天前
人工智能·python·学习·langchain·faiss·agentai
LangChain 向量存储:Chroma、FAISS在学 Chroma/FAISS 之前,必须先搞懂两个核心问题:为什么要用向量存储? 和 什么是嵌入(Embedding)?
Muyuan199817 天前
python·django·pdf·fastapi·faiss
27.RAG 系统中的上下文充分性判断:从 Chunk 数量、FAISS 距离到 LLM Relevance Gate通过RAG技术可以在一定程度上消除大模型的幻觉,但是如果召回的知识不够充分,那么大模型的回答仍会存在一定幻觉,验证上下文是否充分是为了判断大模型回答的结果是否可信。一般在有充分的上下文作为支撑的时候,我们才能相信大模型给了我们正确答案。围绕判断检索是否充分,最近我做了几次迭代。
chushiyunen22 天前
数据库·faiss
faiss向量检索库(并非向量数据库)轻量 # 对 数据库 # 错,它不是一个完整的数据库(没有服务、没有事务、没有分布式),只是一个向量检索库
AI木马人23 天前
数据库·milvus·faiss
8.【向量数据库深度对比】Milvus vs FAISS vs Pinecone(真实项目选型指南)刚做RAG时,我卡了2天:👉 “到底选哪个向量库?”👉 小规模(<10万数据)👉 中规模👉 商业产品
竹之却1 个月前
人工智能·大模型·检索增强·faiss·rag
【Agent-阿程】AI先锋杯·14天征文挑战第14期-第6天-大模型RAG检索增强生成实战技术标签:人工智能、大模型、RAG、检索增强、LangChain、向量数据库、FAISS大模型训练数据存在时间截止点,无法获取训练后新增的知识,回答易出现过时、错误、幻觉。
guslegend1 个月前
人工智能·大模型·faiss·rag
第9节:FAISS,HNSW还是BM25?如何选择最适合业务的向量检索引擎?如何选择最适合业务的向量检索引擎RAG与Agent性能调优:第8节:打造可配置,可扩展的自动化预处理流水线Gitee地址:https://gitee.com/agiforgagaplus/OptiRAGAgent
weisian1511 个月前
数据库·langchain·faiss·向量数据库·chroma
进阶篇-LangChain篇-10--向量数据库选型指南:本地FAISS, Chroma与云原生方案作者:Weisian 发布时间:2026年3月直击痛点:“明明把文档都转成了向量,存哪儿?怎么查?本地FAISS跑得飞快,但重启后数据全没了;想用Chroma做持久化,过滤条件怎么写总报错;数据量大了之后,检索慢得像蜗牛——向量数据库到底怎么选、怎么用?”
森森-曦2 个月前
faiss
在复现overlaptranformer论文中,进行库faiss安装的,解决方案。1.我的python版本为3.9.16,numpy版本为1.24.2时:它默认安装版本是faiss的版本为1.13.0,会默认自动安装numpy的版本为2.0.x版本。但是我环境其他库要求numpy版本要低于这个2.0.x版本。但是又得大于1.20.3版本。所以根据该仓库提供的requirements.txt版本型号安装。也是不行。
liliangcsdn2 个月前
人工智能·全文检索·faiss
如何使用向量库faiss和LLM判断问题是否被记录在实际去重应用场景中,我们可能经常需要判断某个问题检查是否被记录。问题库规模可能很大,比如几千条记录,直接人工判断不太现实。
Le0v1n2 个月前
faiss
Faiss:大规模向量相似度检索在计算机视觉、自然语言处理、推荐系统等领域的工程实践中,“从百万/亿级向量中快速找出最相似的TopK个” 是一个极其常见的需求。比如:
zhojiew2 个月前
人工智能·机器学习·faiss
在RAG系统中对FAISS,HNSW,BM25向量检索引擎选型的问题在 RAG(Retrieval-Augmented Generation,检索增强生成)系统中,有一个核心问题贯穿始终如何在毫秒级延迟内,精准召回最有助于大模型回答问题的 top-k 文本片段?这很大程度上取决于你选择了什么样的检索引擎。目前主流的三种方案——BM25、FAISS、HNSW——各有千秋,但在实际选型中,很多团队存在以下误区:
深藏功yu名2 个月前
数据库·人工智能·python·ai·agent·faiss·chroma
Day24:向量数据库 Chroma_FAISS 入门上期咱们搞定了 Embedding 向量化,把文字变成了机器能懂的数字向量。但很多同学把向量生成后就 “乱扔”,导致检索慢、找不到、甚至丢失! 今天咱们就给向量找个 “智能豪宅”—— 向量数据库!Chroma 新手友好,FAISS 性能炸裂,保姆级教程 + 完整代码,看完直接写进简历!
深藏功yu名2 个月前
数据库·人工智能·python·ai·agent·faiss·chroma
Day24(进阶篇):向量数据库 Chroma_FAISS 深度攻坚 —— 索引优化、性能调优与生产级落地Day24 基础版我们完成了向量数据库的入门落地,但基础版在生产环境中漏洞百出:Chroma 检索延迟高、FAISS 索引易丢失、百万级向量库性能雪崩、持久化机制不完善… 这些才是资深玩家要解决的核心问题。
爱打代码的小林2 个月前
langchain·大模型·faiss·rag
基于 LangChain + 通义千问 + FAISS 构建 RAG 问答系统Retrieval-Augmented Generation(检索增强生成,简称 RAG)是当前大模型应用开发的核心技术范式,它解决了大模型 “知识过时”“幻觉严重”“无法处理私有数据” 三大核心问题。其核心逻辑是:先从私有知识库(如 PDF 文档)中检索与用户问题相关的信息,再将这些信息作为上下文传给大模型,让模型基于检索到的精准信息生成回答。
麦麦大数据3 个月前
typescript·langchain·flask·vue3·faiss·rag
M004_基于Langchain+RAG的银行智能客服系统设计与开发欢迎关注B站:麦麦大数据 https://space.bilibili.com/1583208775随着金融科技的快速发展,银行客户服务面临着前所未有的挑战。传统的人工客服存在响应慢、成本高、服务时间受限等问题。为了提升客户服务体验,本文将介绍一款基于**LangChain + RAG(检索增强生成)**技术构建的银行智能客服系统。
veFuwcCVSXz3 个月前
faiss
三相开绕组永磁同步电机的容错控制三相开绕组永磁同步电机容错控制。最近在搞三相开绕组永磁同步电机项目,发现这货虽然性能强悍,但绕组开路时真能让人抓狂。传统控制策略一旦遇到绕组故障,整个系统直接躺平给你看。今天就聊聊怎么让电机在断线、短路等突发状况下还能接着干活。