词嵌入Embedding:Token离散转连续向量规则、RoPE特性、微调适配实践.185如果接触过大模型调用、或从事AI应用开发的工程师,基本天天都和Embedding打交道,分词Token、向量检索、语义匹配、RAG知识库、大模型对话生成,处处都离不开词嵌入。但如果没有刻意的深入挖掘,很可能我们的了解程度仅仅停留在把文字变成数字向量这个浅层定义,不知道它为什么能支撑语义理解,不知道近义词、歧义词在向量空间如何区分,不清楚RoPE位置编码不能乱改的底层原因,更不懂词表、嵌入初始化、领域微调、多语言对齐的深层逻辑。