技术栈
embedding
闵孚龙
12 天前
rnn
·
transformer
·
embedding
常用网络层:Linear、Conv、RNN、Embedding、Transformer
PyTorch 的网络层,都是 nn.Module。它们有参数,有 forward,有状态,也能被递归注册到模型里。
老刘说AI
13 天前
人工智能
·
stable diffusion
·
架构
·
embedding
类Sora模型:解锁动态视觉艺术的密码
AI生成文字、图片、视频的核心前提,本质是模型对内容的“理解”——生成文字需先读懂文字语义,生成图片需先看懂图像特征,文生图则需同时吃透提示词与图像逻辑,视频生成同样离不开对视频内容的深度解析。
沪漂阿龙
14 天前
人工智能
·
python
·
embedding
Embedding:文本怎么变成向量?语义检索为什么能工作?
Embedding 不是可有可无的组件,它是 RAG 的地基。地基歪了,后面 Retriever、Rerank、Prompt 再漂亮也救不回来。
大模型任我行
15 天前
人工智能
·
语言模型
·
embedding
·
论文笔记
谷歌:多模态嵌入Gemini Embedding 2
📖标题:Gemini Embedding 2: A Native Multimodal Embedding Model from Gemini 🌐来源:arXiv, 2605.27295v1
kisdiem
15 天前
embedding
·
rag
Embeddings 到底是什么
在普通程序里,文字首先只是字符串。字符串可以做精确匹配,却很难直接回答“这两句话是不是在说同一件事”。 例如,“怎样重置登录密码”和“我忘记密码了”几乎没有相同词汇,但人一眼就能看出它们高度相关。
me832
16 天前
人工智能
·
ai
·
embedding
【AI面试】小白理解大模型:关于RoPE 旋转位置嵌入
第一,RoPE 天然实现相对位置编码,不像绝对编码依赖绝对位置;第二,旋转操作不会破坏词向量本身的语义,特征更纯粹;第三,角度连续可变,长文本外推能力远优于传统绝对位置编码;第四,能让注意力随词距自然衰减,更符合语言逻辑。
大模型推理
17 天前
embedding
·
vllm
《Nano-vLLM 源码解读》第 18 篇 · Embedding 与 LM Head
nano-vllm 用千行代码拆解 vLLM 核心,是读懂大模型推理最快的捷径。L13 给出 Qwen3 的骨架,L14 到 L17 拆解了注意力子层用到的模块:RMSNorm、RoPE、Linear 家族、注意力本体。还剩残差流的两端——开头把 token id 变成向量的 embed_tokens、结尾把 hidden 变成 logits 的 lm_head。本篇拆解这两个模块。
CSDN官方博客
19 天前
嵌入式硬件
·
物联网
·
embedding
「谁说嵌入式只是调包和焊板子?」—— 2026嵌入式全栈技术征锋令
谁说嵌入式只会“Ctrl+C 调包”和“拿电烙铁焊板子”?2026嵌入式硬核技术大赏正式启幕!本次活动专为硬核硬件/软件开发者打造,无论你是刚玩转裸机外设的萌新,还是精通RTOS调度、死磕底层驱动的行业老手,亦或是执掌系统架构的大神?!这里都是你证明实力的舞台!
尽兴-
19 天前
算法
·
embedding
·
欧氏距离
·
向量检索
·
余弦相似度
2.1 向量基础:Embedding、余弦相似度、欧氏距离、向量检索
如果说 LLM 是大脑,那向量就是它的「神经信号编码」。人类用文字交流,计算机用数字计算,而 Embedding 是连接这两个世界的桥梁。不懂向量,就不懂 RAG;不懂 RAG,就没法让 LLM 真正落地到实际业务中。
MemoriKu
19 天前
android
·
开发语言
·
前端
·
flutter
·
架构
·
音视频
·
embedding
Flutter 相册 APP 视频模态稳定化实战:从视频抽帧、Embedding 元数据到 Android 真机启动修复
最近在做一个 Flutter 相册类 APP,核心功能是对本地图片和视频进行 AI 分析,包括:图片 / 视频入库;
糖果店的幽灵
20 天前
人工智能
·
spring
·
embedding
Spring AI 从入门到精通-Embedding
想象你走进一家咖啡店,你闻到咖啡的香气、烤面包的焦味、还有一点点奶香。你的大脑不需要看到"咖啡豆"三个字,就能判断这是咖啡店。
啦啦啦_9999
21 天前
embedding
nn.Embedding()说明
一般送给模型之前的输入数据,如果不考虑embedding,直接linear、gru、RNN、transformer这种模型,一般输入就是三维的 [batch_size, sql_len, embedding_dim];但如果中间要经过embedding层,那么在送给embedding之前,一定是 [batch_size, seq_len];
lhxcc_fly
22 天前
langchain
·
llm
·
embedding
6.3.1RAG--存储(嵌入向量)
为什么会将嵌入方法设置成文档和询问。核心是不同厂商或者同一厂商对文档列表和用户输入问题有不同的优化策略使得向量形成更加合理。
摸鱼同学
22 天前
ai
·
chatgpt
·
embedding
·
agent
·
向量数据库
04-Embedding 和向量数据库:让机器真正理解语义
传统搜索匹配关键词,向量搜索匹配"意思"。当你问"怎么让电脑跑更快",它能找到"提升计算机性能的方法"——尽管两个句子没有一个词相同。这就是 Embedding 的魔法。
霸道流氓气质
1 个月前
人工智能
·
spring
·
embedding
Spring AI Alibaba + Ollama+Embedding向量化项目完整指南
SpringBoot+LangChain4j+Ollama+RAG(检索增强生成)实现私有文档向量化检索回答:
Komorebi_9999
1 个月前
大模型
·
embedding
多模态 Embedding、CLIP 概念
内嵌补充:对比文本 Embedding,总结异同点先复习你学过的文本 Embedding: 将文字、词语、句子,转化为固定维度的浮点向量。
不爱吃糖の糖糖
1 个月前
人工智能
·
embedding
RAG 07:RAG 高级范式与幻觉防控
学习笔记:详述 RAG 系统从 Naive 到 Agentic 的三代演进,Self-RAG、CRAG、GraphRAG、Agentic RAG 四大高级范式,以及幻觉的系统性防控策略
专职
1 个月前
langchain
·
embedding
LangChain开发Agent智能体(接入阿里云百炼Embedding模型)
单独来说,大语言模型无法采取行动 - 它们只能输出文本。LangChain 的一个重要用例是创建代理。
小何code
1 个月前
embedding
·
向量数据库
·
rag
·
检索增强生成
·
llm应用
人工智能【第52篇】RAG系统实战:检索增强生成技术详解
作者的话:大语言模型虽然强大,但存在知识截止、幻觉等问题。RAG(检索增强生成)技术通过将外部知识库与LLM结合,让模型能够基于最新、最准确的信息回答问题。本文将深入解析RAG的原理、架构设计,并带你从零构建一个完整的RAG系统!
格桑阿sir
1 个月前
ai
·
大模型
·
llm
·
embedding
·
agent
·
检索增强
·
rag
10-大模型智能体开发工程师:RAG检索增强生成
系列文章导航:AI系列文章导航目录-持续更新中📝 本文摘要:本文详解RAG技术——解决LLM知识局限(训练数据截止、私有数据未知、专业领域不精)的核心方案,梳理RAG流程(离线索引:文档→分块→嵌入→向量数据库;在线查询:嵌入→向量检索→Top-K→拼接到Prompt→LLM生成),详解关键技术(分块策略、嵌入模型选择、向量数据库选型、混合检索、重排序),提供最简RAG和生产级RAG架构代码,以及常见问题优化。