embedding model

andwhataboutit?2026-01-24 20:28

Embedding Model 通俗解释

你可以把 嵌入模型（Embedding Model） 理解成一个 "语言翻译官"：

它把人类能看懂的文本 （比如 "苹果""今天天气好"），翻译成计算机能理解的数字向量 （一串有序的数字，比如 [0.12, -0.34, 0.56, ...]）；
这个数字向量就叫 Embedding（嵌入向量） ，向量的长度（维度）由模型决定（比如 nomic-embed-text 是 768 维，OpenAI 的 text-embedding-3-small 是 1536 维）；
关键特点：语义相似的文本，生成的向量也相似（比如 "苹果手机" 和 "iPhone" 的向量距离很近，"苹果手机" 和 "香蕉" 的向量距离很远）。

二、Embedding Model 的核心作用

为什么需要它？举几个你能感知到的场景：

语义搜索：比如你搜 "如何用 Ollama 调用本地模型"，即使关键词不完全匹配，也能找到 "本地部署 Ollama 并调用 qwen3:8b" 的内容（因为两者向量相似）；
文本分类 / 聚类：把相似的文本自动归为一类（比如把 "手机卡顿""手机反应慢" 归为 "手机性能问题"）；
AI 问答的上下文匹配 ：比如你问 AI"qwen3:8b 怎么生成嵌入向量"，AI 会先把你的问题转成向量，再从知识库中找向量最相似的内容作为答案依据。

三、嵌入模型 vs 大语言模型（比如 qwen3:8b）

你之前用的 qwen3:8b 是大语言模型（LLM），和专门的嵌入模型有明显区别：

类型	核心用途	输出结果	代表模型
嵌入模型（Embedding）	文本转向量、语义相似度计算	固定长度的数字向量	nomic-embed-text、text-embedding-3-small
大语言模型（LLM）	生成文本、问答、创作	自然语言文本	qwen3:8b、gpt-4、llama3

上一篇：LeetCode Hot100（1/100）——1. 两数之和 (Two Sum)

下一篇：VR每日热点简报2026.1.23

热门推荐

01GitHub 镜像站点 02【OpenClaw 本地实战 Ep.3】突破瓶颈：强制修改 openclaw.json 解锁 32k 上下文记忆 03OpenClaw 使用和管理 MCP 完全指南 04Clawdbot部署教程：解决‘gateway token missing’授权问题的完整步骤 05OpenClaw + 飞书（Feishu）环境搭建指南 06Claude Code + GLM4.7 避坑指南：解决 Unable to connect to Anthropic services 07AI 规范驱动开发“三剑客”深度对比：Spec-Kit、Kiro 与 OpenSpec 实战指南 08Window 10部署openclaw报错node.exe : npm error code 128 09AI Agent 平台横评：ZeroClaw vs OpenClaw vs Nanobot 10OpenClaw优化飞书API 额度已耗尽问题