技术栈
embedding
糖果店的幽灵
5 小时前
人工智能
·
spring
·
embedding
Spring AI 从入门到精通-Embedding
想象你走进一家咖啡店,你闻到咖啡的香气、烤面包的焦味、还有一点点奶香。你的大脑不需要看到"咖啡豆"三个字,就能判断这是咖啡店。
啦啦啦_9999
19 小时前
embedding
nn.Embedding()说明
一般送给模型之前的输入数据,如果不考虑embedding,直接linear、gru、RNN、transformer这种模型,一般输入就是三维的 [batch_size, sql_len, embedding_dim];但如果中间要经过embedding层,那么在送给embedding之前,一定是 [batch_size, seq_len];
lhxcc_fly
2 天前
langchain
·
llm
·
embedding
6.3.1RAG--存储(嵌入向量)
为什么会将嵌入方法设置成文档和询问。核心是不同厂商或者同一厂商对文档列表和用户输入问题有不同的优化策略使得向量形成更加合理。
摸鱼同学
2 天前
ai
·
chatgpt
·
embedding
·
agent
·
向量数据库
04-Embedding 和向量数据库:让机器真正理解语义
传统搜索匹配关键词,向量搜索匹配"意思"。当你问"怎么让电脑跑更快",它能找到"提升计算机性能的方法"——尽管两个句子没有一个词相同。这就是 Embedding 的魔法。
霸道流氓气质
6 天前
人工智能
·
spring
·
embedding
Spring AI Alibaba + Ollama+Embedding向量化项目完整指南
SpringBoot+LangChain4j+Ollama+RAG(检索增强生成)实现私有文档向量化检索回答:
Komorebi_9999
8 天前
大模型
·
embedding
多模态 Embedding、CLIP 概念
内嵌补充:对比文本 Embedding,总结异同点先复习你学过的文本 Embedding: 将文字、词语、句子,转化为固定维度的浮点向量。
不爱吃糖の糖糖
8 天前
人工智能
·
embedding
RAG 07:RAG 高级范式与幻觉防控
学习笔记:详述 RAG 系统从 Naive 到 Agentic 的三代演进,Self-RAG、CRAG、GraphRAG、Agentic RAG 四大高级范式,以及幻觉的系统性防控策略
专职
8 天前
langchain
·
embedding
LangChain开发Agent智能体(接入阿里云百炼Embedding模型)
单独来说,大语言模型无法采取行动 - 它们只能输出文本。LangChain 的一个重要用例是创建代理。
小何code
8 天前
embedding
·
向量数据库
·
rag
·
检索增强生成
·
llm应用
人工智能【第52篇】RAG系统实战:检索增强生成技术详解
作者的话:大语言模型虽然强大,但存在知识截止、幻觉等问题。RAG(检索增强生成)技术通过将外部知识库与LLM结合,让模型能够基于最新、最准确的信息回答问题。本文将深入解析RAG的原理、架构设计,并带你从零构建一个完整的RAG系统!
格桑阿sir
8 天前
ai
·
大模型
·
llm
·
embedding
·
agent
·
检索增强
·
rag
10-大模型智能体开发工程师:RAG检索增强生成
系列文章导航:AI系列文章导航目录-持续更新中📝 本文摘要:本文详解RAG技术——解决LLM知识局限(训练数据截止、私有数据未知、专业领域不精)的核心方案,梳理RAG流程(离线索引:文档→分块→嵌入→向量数据库;在线查询:嵌入→向量检索→Top-K→拼接到Prompt→LLM生成),详解关键技术(分块策略、嵌入模型选择、向量数据库选型、混合检索、重排序),提供最简RAG和生产级RAG架构代码,以及常见问题优化。
寻道码路
9 天前
java
·
人工智能
·
ai
·
embedding
LangChain4j Java AI 应用开发实战(十):Embedding 模型与文本分类 - 语义向量化
在上一篇文章中,我们学习了 Few-Shot Learning 如何通过示例提升模型准确率。但你是否思考过:如何让计算机真正"理解"文本的语义?传统的关键词匹配无法解决"我的包裹在哪里?"和"订单物流状态查询"这类语义相同但无共同关键词的问题。Embedding(文本嵌入)技术正是解决这一难题的钥匙,它将文本转换为高维向量,让计算机能够计算语义相似度,从而实现智能搜索、文本分类、推荐系统等应用。 本文将带你从零开始掌握 Embedding 技术,深入讲解文本到向量的数学原理,对比 OpenAI、Huggi
贺国亚
9 天前
prompt
·
embedding
RAG检索增强-向量库与Chunking
风格说明:本篇是 设计型 + 数学型 + 操作型混合——前半段(§1-§4)讲 RAG 全景与核心选型;中段(§5-§8)讲 chunking、embedding、向量库、re-ranking 的设计权衡;后半段(§9-§11)讲大厂题、真实事故;§12-§13 为 Staff/Architect 向量库选型与进阶范式纵深;§99 为本章冲刺满分答与 Checklist。这是当代 AI 应用的"必杀技"——没做过 RAG 的 AI 工程师面试基本通不过。
不爱吃糖の糖糖
10 天前
人工智能
·
embedding
RAG 06:RAG 多路召回与检索优化策略详解
学习笔记:详述 RAG 系统中多路召回的原理与实现,以及索引层、查询层、召回层、重排序层的四层检索优化框架
布吉岛的石头
10 天前
java
·
缓存
·
embedding
Java 程序员第 38 阶段:Embedding 向量缓存实战,减少重复向量化计算开销
在 Java 后端应用中,Embedding 向量生成通常是 RAG(检索增强生成)系统的性能瓶颈。每次查询都需要将文本转换为高维向量(通常 768 维、1024 维或 1536 维),计算开销巨大。通过向量缓存,可以将已经计算过的文本向量存储起来,避免重复计算,将响应延迟从 100-200ms 降低到 1-5ms。
tzc_fly
11 天前
embedding
Tuna-2:直接像素embedding打败视觉编码器
这篇名为 《Tuna-2: Pixel Embeddings Beat Vision Encoders for Multimodal Understanding and Generation》 的论文由 Meta AI、香港大学和滑铁卢大学的研究人员合作发表。
孟林洁
12 天前
人工智能
·
ai
·
prompt
·
embedding
Java转AI应用开发速成(2)——核心概念扫盲Token、Prompt、Embedding 是什么
大语言模型是一种基于深度学习的人工智能模型,它能够从海量的文本数据中学习并理解人类语言的模式和规则。这些模型通常包含数十亿甚至更多的参数,通过复杂的神经网络结构来模拟人类的语言处理能力。 参考:之前的文章:一文读懂大语言模型
这是谁的博客?
12 天前
ai
·
embedding
·
文本处理
·
mteb
·
bge
·
向量表示
Embedding 模型深度解析:文本嵌入技术原理与 MTEB 评估体系
本文深入解析文本 Embedding 模型的技术原理,从基础概念到主流模型架构,全面探讨 MTEB 评估体系的设计与应用。读者将理解 Embedding 如何将文本转换为向量表示,掌握模型选型策略与评估方法。
夜雪闻竹
13 天前
人工智能
·
算法
·
embedding
从零实现 Embedding 服务:文本转向量
本文面向:想理解 Embedding 服务原理和实现细节的开发者。 预计阅读时间:12 分钟 最终效果:理解文本转向量的完整流程——构建、分块、API 调用、存储、语义搜索,能独立实现一个最小 Embedding 服务。
养肥胖虎
13 天前
llm
·
embedding
·
rag
完整学习LLM(五):Embedding是什么,为什么文本能变成向量
好家伙, 先贴一篇好文章 https://developers.openai.com/api/docs/guides/embeddings (openai团队写的,值得信赖)