技术栈
milvus
程序员老邢
4 小时前
人工智能
·
spring boot
·
后端
·
ai
·
语言模型
·
milvus
【产品底稿 08】商助慧 AI 仿写实战复盘:RAG 知识库 + 大模型联动,一键生成技术底稿
从文档上传、向量入库,到 AI 流式仿写全链路闭环。商助慧在 AI 内容创作板块,完成了从“能用”到“好用”的关键升级。
青龙小码农
5 小时前
elasticsearch
·
milvus
·
ollama
·
rga
milvus+elasticsearch+ollama实现企业级RAG搭建
[安装参考](https://blog.csdn.net/wenwang3000/article/details/145705858) 这里需要2种类型的
AI木马人
2 天前
数据库
·
milvus
·
faiss
8.【向量数据库深度对比】Milvus vs FAISS vs Pinecone(真实项目选型指南)
刚做RAG时,我卡了2天:👉 “到底选哪个向量库?”👉 小规模(<10万数据)👉 中规模👉 商业产品
YiRan_Zhao
3 天前
milvus
milvus面试题
A:A:A:A:A:A:A:A:A:A:A:A:表格A:A:A:A:A:A:A:
许彰午
3 天前
人工智能
·
milvus
# 约94万条热线问题怎么去重?动态相似度阈值+Milvus,不用LLM一毛钱
政务热线每天的来电都会转成文字记录。积累了几年下来,问题库动辄几十万条。拿来做RAG知识库之前,必须先去重——不然"养老保险怎么交"和"养老金怎么缴纳"是同一条知识,存两份就浪费,检索时还可能把两个相似但略有不同的答案都捞出来,LLM拿到矛盾的上下文就开始胡编。
程序员老邢
3 天前
java
·
经验分享
·
后端
·
ubuntu
·
docker
·
容器
·
milvus
【技术底稿 23】Ollama + Docker + Ubuntu 部署踩坑实录:网络通了,参数还在调
下午5点到晚上10点半,5个半小时。代码一行没改,全是环境、配置、默认参数的坑。 网络隔离、防火墙、Ollama默认监听127.0.0.1、Linux vs Windows差异——每一个都踩了一遍。 目前网络已通,向量模型的上下文问题还在调。
格鸰爱童话
3 天前
python
·
milvus
python使用milvus向量库
milvus向量库使用的时候,需要先本地安装,使用windows安装milvus需要使用docker使用管理员身份打开powershell,执行
smileNicky
5 天前
人工智能
·
spring
·
milvus
Spring AI系列之集成 Milvus 构建 RAG 智能问答系统
技术栈一览大语言模型(LLM)虽然强大,但存在两个致命短板:RAG(检索增强生成) 技术正是解决这些问题的最佳方案。
程序员老邢
5 天前
java
·
人工智能
·
经验分享
·
spring boot
·
ai
·
milvus
【产品底稿 06】商助慧V1.2实战复盘:Milvus向量库重构+RAG仿写升级+前端SSE排版彻底修复
本篇为商助慧・RAG 个人专属 AI 写作助手 V1.2 版本迭代落地实践记录,承接【产品底稿 05】 V1.1 版本内容。
YiRan_Zhao
6 天前
milvus
Milvus从连接到查询操作手册
简单来说,Milvus 只是一个存储和检索容器,它不负责生成向量。向量是由你的 AI 模型(如 BERT, ResNet, GPT, Qwen-Embedding 等)生成的。因此,Milvus 的维度设置必须与模型输出的向量长度严格一致。
庚昀◟
6 天前
人工智能
·
langchain
·
milvus
基于 LangChain、RAG、LoRA 、Streamlit 的知识库问答客服系统从零到一(附项目源码)
项目名称: KB-CustomerService 基座模型: Qwen2.5-3B-Instruct 核心架构: LangChain + RAG + LoRA 微调 部署环境: 云服务器 + 4090 GPU
不爱吃米饭_
7 天前
milvus
Milvus 和 PGVector,哪个更好?
在做RAG(检索增强生成)应用或推荐系统时,很多小伙伴都会遇到同一个灵魂拷问:向量数据库到底该怎么选?
响叮当!
7 天前
数据库
·
milvus
Milvus 向量数据库使用指南
gRPC 端口: localhost:19530健康检查: http://localhost:9091/healthz
YiRan_Zhao
9 天前
milvus
milvus-2.3.12安装部署
https://milvus.io/docs/v2.3.x使用 Docker Compose 安装 Milvus standalone(即单机版),进行一个快速 milvus 的体验。
YiRan_Zhao
10 天前
milvus
milvus的客户端pymilvus安装
参考文档https://milvus.io/api-reference/pymilvus/v2.3.x/About.md
程序员老邢
10 天前
运维
·
机器人
·
企业微信
·
devops
·
milvus
【技术底稿 17】DevOps 监控告警实战踩坑复盘 —— 企微机器人告警 + Milvus 向量库监控全流程验证
本次实战围绕 DevOps 基础设施监控体系完善展开,基于现有 Docker 单机 Linux 环境、Prometheus+Alertmanager 原生监控架构,开展两项核心工作:
james的分享
11 天前
数据库
·
milvus
向量数据库之Milvus
Milvus = 专门做“向量检索”的数据库本质上解决的问题是:在“高维向量空间”中做近似最近邻搜索(ANN, Approximate Nearest Neighbor)
程序员老邢
12 天前
java
·
spring boot
·
程序人生
·
ai
·
milvus
【产品底稿 05】商助慧 V1.1 里程碑:RAG 文章仿写模块全链路实现
(承接【产品底稿 04】,从 “能入库” 到 “会用库” 的关键一步)在【产品底稿 04】中,我们完成了 CSDN 爬虫入库、MySQL 结构化存储、Milvus 向量库全链路打通,解决了文章 “从哪来、怎么存” 的问题。
Flying pigs~~
12 天前
数据库
·
人工智能
·
缓存
·
大模型
·
milvus
·
知识库
·
rag
从零到一构建企业级 RAG 问答系统:一个完整的模块化实践指南
在人工智能技术飞速发展的今天,大语言模型(LLM)展现出了惊人的能力。然而,如何让 LLM 真正落地到垂直领域,解决实际问题,仍然是一个值得深入探讨的课题。RAG(Retrieval-Augmented Generation,检索增强生成)作为目前最成熟的解决方案之一,通过将外部知识库与 LLM 结合,有效解决了模型知识更新滞后、幻觉等问题。
Flying pigs~~
12 天前
agent
·
milvus
·
rag
·
智能体
·
检索增强生成
RAG 项目完整学习笔记与总结
这是一个生产级的多层 RAG 问答系统,核心特点:多级检索降级:Redis 缓存 → BM25 关键词检索 → Milvus 向量检索,层层递进