embedding

猫头虎5 小时前
人工智能·langchain·开源·prompt·aigc·embedding·agi
如何搭建 24 小时 AI 直播平台:魔珐星云数字人打造无人值守 “AI 销冠” 全流程实战教程摘要:本文从零到一拆解基于魔珐星云端侧 SDK 与大模型 LLM 的无人直播间架构,以 React 19 + Vite + TypeScript 为技术栈,手把手教你搭建可低延迟交互、支持弹幕实时响应、支持多平台推流的 AI 数字人带货直播间,实现真正可商用的 24 小时无人直播。
ydmy3 天前
python·深度学习·embedding
Embedding层(个人理解)含义:嵌入层通过可学习的权重矩阵将整数索引映射为稠密向量,是 NLP 模型的第一层,相当于查字典。注意:
西西弗Sisyphus4 天前
深度学习·transformer·embedding
Transformer 嵌入层 nn.Embedding 到底是什么?flyfish通过一个简单的 PyTorch 示例展示嵌入层(无偏置项)与线性层是完全等价的。只是工作方式不同,嵌入层通过索引查表实现运算,而线性层通过矩阵 - 向量乘法实现运算。 既然有线性层,为什么还要用嵌入层? 算出来的结果完全一样,但工作的方式天差地别;嵌入层是线性层在高维稀疏数据场景下的高效版。
城管不管5 天前
java·开发语言·python·embedding·嵌入模型
嵌入模型Embedding Model嵌入模型(Embedding Model) 是一类将离散、非结构化的高维数据(如文本、图像、音频),映射为低维、稠密、连续的数值向量(嵌入向量) 的机器学习模型。核心目标是保留数据的语义 / 特征关系—— 相似内容的向量在空间中距离更近,差异大的则距离更远。
你不是我我6 天前
embedding
【Java 开发日记】向量检索的流程是怎样的?Embedding 和 Rerank 各自的作用?目录一、向量检索的整体流程离线阶段(索引构建)在线阶段(检索与重排)二、Embedding 的作用核心特点
j_xxx404_8 天前
人工智能·ai·embedding
【AI大模型入门(三)】大模型API接入、Ollama本地部署与RAG核心(Embedding)上篇文章:【AI大模型入门(二)】提示词工程进阶目录一、 AI 接入方式选型:云端 vs 本地二、 实战1:通过 API 接入(以 OpenAI/兼容协议为例)
算.子9 天前
人工智能·spring·embedding
【Spring AI 实战】七、Embedding 向量化与向量数据库选型对比大家好,我是冰点,今天我们继续聊SpringAI的基本用法和特性建议先阅读第五篇《RAG 核心原理》和第六篇《文档 ETL 实战》,理解 Embedding 在 RAG 中的角色。 本文聚焦 Embedding 与向量库的选型思路;具体客户端初始化方式请结合你当前使用的 Spring AI starter 版本确认。
rising start13 天前
embedding·dify·rag
RAG入门与在Dify中的简单实践本文将带你完成 RAG 技术从理论到实战的全流程。我们以 长江科技有限公司内部知识库:新员工入职指南问答助手 为例,基于 Dify 平台进行实操演示,每一步都会给出具体的操作指引与最佳实践建议。
coderlin_13 天前
mysql·elasticsearch·embedding
Langgraph项目 一(mysql,es,qdrant,embedding模块)数据库表可以通过hive转为数据仓库的维度表,我们只需要写sql,就可以通过hive转为可以查数据仓库的语句。
deephub15 天前
人工智能·大语言模型·embedding·rag
无 Embedding、无向量数据库的 RAG 方法:PageIndex 技术解析PageIndex 是一种无向量、基于推理的检索增强生成(RAG)方法,无需 Embedding、分块或向量数据库即可从长文档中检索答案。
寂寞旅行15 天前
人工智能·embedding
模型蒸馏: 小模型也有“大用“模型蒸馏是一种模型压缩技术,核心思想是用大模型(教师)教小模型(学生),让小模型在保持较小规模的同时,尽可能接近大模型的性能。
deephub17 天前
人工智能·python·机器学习·embedding·向量检索
向量相似性搜索详解:Flat Index、IVF 与 HNSW要理解向量搜索先要弄清楚为什么需要向量数据库,关系型数据库处理结构化数据得心应手。所谓结构化数据就是那些具有固定列的表格数据,比如说:姓名、年龄、薪资、日期。这类数据精确匹配查询很简单:"Age > 25"或"Name = Subham"就能拿到想要的结果。
华农DrLai18 天前
人工智能·深度学习·prompt·transformer·知识图谱·embedding
什么是LLM做推荐的三种范式?Prompt-based、Embedding-based、Fine-tuning深度解析🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!
rrrjqy18 天前
人工智能·spring·embedding
深入浅出 RAG:万物皆可向量化 (Embedding) 与 Spring AI + pgvector 实战给大模型装上真正的“外接硬盘”:从语义检索原理到 Spring Boot 工程落地在 RAG(检索增强生成)系列的前两篇文章中,我们聊了为什么需要 RAG,也详细讲解了如何通过 Chunking 策略把长文档“切碎”。今天,我们要啃下一块不可或缺的硬骨头:这些切碎的文本,系统到底是怎么理解并检索出来的?
deephub20 天前
人工智能·python·大语言模型·embedding·向量检索
向量数据库对比:Pinecone、Chroma、Weaviate 的架构与适用场景向量数据库存储 Embedding,也就是文本、图像或音频的数值表示,并在查询时检索语义上最接近的结果。RAG 系统正是基于这一机制运作。本文对比三个主流方案,每个都附有 Python 代码,均来自实际在生产环境中使用三者的经验。 三种选择:Pinecone 用于生产级规模,Chroma 用于本地原型开发,Weaviate 用于混合搜索。
F_D_Z21 天前
分布式·word·embedding
Word Embedding :从分布式假设到神经网络语言模型Word Embedding(词嵌入)是一种将离散的词汇符号映射到连续的低维稠密向量空间的技术。在这个向量空间中,语义相似的词在几何距离上彼此接近,从而实现了从"符号匹配"到"语义计算"的跨越 。
pzx_00122 天前
人工智能·pytorch·embedding
【Pytorch】nn.Embedding函数详解Pytorch官方注解:https://docs.pytorch.org/docs/stable/generated/torch.nn.modules.sparse.Embedding.html
Anastasiozzzz22 天前
数据库·人工智能·ai·embedding
深入研究RAG: 在线阶段-查询&问答在前面的学习中,我们研究了RAG在离线阶段进行的工作----文档解析、文本分片与向量化,那么接下来就来研究一下在线阶段如何使用我们已经准备好的数据吧
laufing22 天前
langchain·embedding·rag
RAG 基础版 -- 基于langchain框架基于langchain 0.3.28 构建RAGpending
热爱生活的猴子25 天前
笔记·embedding
Tokenizer 与 Embedding 核心笔记核心逻辑:文本 → Tokenizer(文字转ID)→ Embedding(ID转语义向量),二者是模型处理文本的“必经两步”,缺一不可