embedding

中国胖子风清扬15 小时前
java·spring boot·python·spring·ai·embedding·rag
PageIndex:用推理替代向量的下一代 RAG 架构GitHub 仓库:https://github.com/zhoubyte/java-ai 如果你觉得这个项目有价值,欢迎 Star ⭐ 和关注,持续分享 AI 工程化实践!
老刘说AI6 天前
人工智能·python·语言模型·embedding·ai编程
Embedding不是魔法:把文字变成数字的底层逻辑在技术语境里,“Embedding”常被称作“嵌入”,这是学术领域的规范表述,而从实际计算逻辑来看,它本质是一种向量化的处理方式。
m0_372257027 天前
人工智能·深度学习·机器学习·embedding
BM25 + Embedding 混合检索 实现我们做一个标准的:🔎 BM25(关键词召回) + Embedding(语义召回) + 融合排序下面给你一个最小可用版本。
紫小米8 天前
prompt·embedding·ai编程
Agent的范式范式(Paradigm) 是一种通用的模式、思路或框架,用来指导我们如何理解和解决问题。每种范式背后有不同的思路、优缺点和适用场景,但它们解决的是同一个问题。
西西弗Sisyphus8 天前
transformer·embedding·view·transpose·multi-head
从零实现 Transformer:第 0 部分 - 基础( Foundations)view 重塑形状 和 transpose 交换维度顺序flyfishview 复用原张量同一块底层内存数据,只是换了一种维度解读方式,不会在内存中创建物理副本。
致Great8 天前
embedding
零索引、零 embedding、纯 grep:DCI直接在原始语料上做 deep research最近翻 arXiv 看到一篇挺有意思的 paper:《Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction》,作者来自 Texas A&M、Waterloo、UCSD、Stanford、UIUC 这一票学校,外加 Verdent AI、Lambda 几家公司。
打小就很皮...9 天前
前端·langchain·embedding·rag
基于 Python + LangChain + RAG 的知识检索系统实战在大模型时代,如何让 AI 基于特定领域的知识库准确回答问题,而不是"胡编乱造"?RAG(Retrieval-Augmented Generation,检索增强生成)是目前最主流的解决方案。本文将带你从零实现一个完整的 RAG 知识检索系统,以汽车参数知识库为场景,涵盖后端、前端、向量数据库的完整链路。
NCU_wander12 天前
embedding
graphrag bm25 和 embedding混合使用知识图谱在模型侧(含训练 / 推理、存储与交换、以及输入大模型的向量格式)主要分三类:符号化三元组(RDF / 属性图)、结构化文本 / JSON、嵌入向量(Embedding)。
庞轩px14 天前
人工智能·自然语言处理·embedding·向量检索·余弦相似度·rag·高维向量空间
Embedding与向量语义——大模型是怎样“理解”文字的?在面试中,如果你在简历上写了“RAG”、“向量检索”,面试官几乎一定会追问一句:“你用了 Embedding,那你说说它的原理是什么?为什么两个词的向量相似,就代表它们语义相近?”
Aision_14 天前
langchain·prompt·aigc·embedding·ai编程·ai写作·agi
LangGraph 中 State、Node、Edge 是怎么协作的?上篇我们区分了 Function Call 和 Agent 工具调用,但那只是"调用方式"的区别,没解决更根本的问题——当一个复杂任务需要多步骤时,Agent 内部是怎么组织这些步骤的?
Arhero14 天前
动态规划·embedding·rag·文本切分·语义分块
Semantic Chunk 为什么需要 Embedding API固定长度分块不需要任何外部服务,语义分块却必须调用 Embedding API——这背后的原因是什么?
鹏子训18 天前
数据库·人工智能·sqlite·embedding
AI记忆新思路:用SQLite替代向量数据库,去EMBEDDINGS化,谷歌开源Google Always On Memory Agent随着AI Agent的发展,AI Agent从问答查询工具向长期助手持续演进,持久记忆成为AI Agent的核心技术之一。当前行业普遍将向量数据库、Embeddings模型视为Agent记忆的标配模块,但多数开发者对“记忆存储的本质”存在理解不深——总是觉得向量数据库是唯一选择。谷歌云开源的Google Always On Memory Agent,以“去EMBEDDINGS化”SQLite替代向量数据库的极简方案,打破了这一认知惯性,这篇文章希望能让开发者们重新深入理解AI Agent记忆的本质。
马优晨20 天前
人工智能·语言模型·embedding·embedding 模型·大语言模型(llm)
大语言模型(LLM)、Embedding 模型、reranker重排序模型 有什么关系你可以把它们想象成一个智能问答团队:用户问了一个问题,这三个模型会这样配合工作:简单说:RAG 三套模型 最佳搭配+直接可用参数(极简落地版)
猫头虎20 天前
人工智能·langchain·开源·prompt·aigc·embedding·agi
如何搭建 24 小时 AI 直播平台:魔珐星云数字人打造无人值守 “AI 销冠” 全流程实战教程摘要:本文从零到一拆解基于魔珐星云端侧 SDK 与大模型 LLM 的无人直播间架构,以 React 19 + Vite + TypeScript 为技术栈,手把手教你搭建可低延迟交互、支持弹幕实时响应、支持多平台推流的 AI 数字人带货直播间,实现真正可商用的 24 小时无人直播。
ydmy24 天前
python·深度学习·embedding
Embedding层(个人理解)含义:嵌入层通过可学习的权重矩阵将整数索引映射为稠密向量,是 NLP 模型的第一层,相当于查字典。注意:
西西弗Sisyphus25 天前
深度学习·transformer·embedding
Transformer 嵌入层 nn.Embedding 到底是什么?flyfish通过一个简单的 PyTorch 示例展示嵌入层(无偏置项)与线性层是完全等价的。只是工作方式不同,嵌入层通过索引查表实现运算,而线性层通过矩阵 - 向量乘法实现运算。 既然有线性层,为什么还要用嵌入层? 算出来的结果完全一样,但工作的方式天差地别;嵌入层是线性层在高维稀疏数据场景下的高效版。
城管不管25 天前
java·开发语言·python·embedding·嵌入模型
嵌入模型Embedding Model嵌入模型(Embedding Model) 是一类将离散、非结构化的高维数据(如文本、图像、音频),映射为低维、稠密、连续的数值向量(嵌入向量) 的机器学习模型。核心目标是保留数据的语义 / 特征关系—— 相似内容的向量在空间中距离更近,差异大的则距离更远。
你不是我我1 个月前
embedding
【Java 开发日记】向量检索的流程是怎样的?Embedding 和 Rerank 各自的作用?目录一、向量检索的整体流程离线阶段(索引构建)在线阶段(检索与重排)二、Embedding 的作用核心特点