前言:
学习大模型之前首先我们需要熟悉各种常用词汇代表的含义,下面不断总结更新我们常见词汇,帮助我们理解记忆:
根据整体流程框架总览:
**一、模型 / 机构类
LLM --- Large Language Model --- 大语言模型
SLM --- Small Language Model --- 小语言模型
MoE --- Mixture of Experts --- 混合专家模型
AGI --- Artificial General Intelligence --- 通用人工智能
OpenAI --- OpenAI --- 开放人工智能(机构名)
GPT --- Generative Pre-trained Transformer --- 生成式预训练 Transformer
DeepSeek --- DeepSeek --- 深度求索(模型 / 机构)
Qwen --- Qwen --- 通义千问
Llama --- Llama --- Meta 开源大模型
GLM --- General Language Model --- 通用语言模型(智谱)**二、架构 / 技术类
Transformer --- Transformer --- Transformer 架构(大模型基础)
Encoder --- Encoder --- 编码器
Decoder --- Decoder --- 解码器
RNN --- Recurrent Neural Network --- 循环神经网络
CNN --- Convolutional Neural Network --- 卷积神经网络
ANN --- Approximate Nearest Neighbor --- 近似最近邻搜索
NN --- Neural Network --- 神经网络
DNN --- Deep Neural Network --- 深度神经网络**三、训练 / 微调类
Pre-training --- Pre-training --- 预训练
SFT --- Supervised Fine-Tuning --- 监督微调
RLHF --- Reinforcement Learning from Human Feedback --- 基于人类反馈的强化学习
DPO --- Direct Preference Optimization --- 直接偏好优化
LoRA --- Low-Rank Adaptation --- 低秩适配(轻量微调)
QLoRA --- Quantized LoRA --- 量化低秩适配
FT --- Fine-Tuning --- 全参数微调****四、推理 / 部署类
Inference --- Inference --- 推理
Context Window --- Context Window --- 上下文窗口
Token --- Token --- 词元(文本基本单位)
vLLM --- Virtual Large Language Model --- 高效大模型推理引擎
TPU --- Tensor Processing Unit --- 张量处理器
GPU --- Graphics Processing Unit --- 图形处理器(训练 / 推理常用)
API --- Application Programming Interface --- 应用程序编程接口
SDK --- Software Development Kit --- 软件开发工具包****五、NLP & 向量相关
NLP --- Natural Language Processing --- 自然语言处理
Embedding --- Embedding --- 词嵌入 / 向量表示
RAG --- Retrieval-Augmented Generation --- 检索增强生成
Vector DB --- Vector Database --- 向量数据库
Semantic Search --- Semantic Search --- 语义搜索****六、任务 / 能力类
NLG --- Natural Language Generation --- 自然语言生成
NLU --- Natural Language Understanding --- 自然语言理解
MT --- Machine Translation --- 机器翻译
QA --- Question Answering --- 问答
CoT --- Chain-of-Thought --- 思维链**
基本概念:
第一部分 机器学习与深度学习基础
一、基础概念
- 机器学习:Machine Learning (ML)
- 人工智能:Artificial Intelligence (AI)
- 深度学习:Deep Learning (DL)
- 模型:Model
- 训练:Training
- 推理 / 预测:Inference / Prediction
- 参数:Parameter
- 超参数:Hyperparameter
二、数据相关
- 数据集:Dataset
- 训练集:Training Set
- 验证集:Validation Set
- 测试集:Test Set
- 特征:Feature
- 标签 / 目标:Label / Target
- 样本:Sample / Instance
- 标注:Annotation
- 归一化:Normalization
- 标准化:Standardization
三、学习范式
- 监督学习:Supervised Learning
- 无监督学习:Unsupervised Learning
- 半监督学习:Semi-supervised Learning
- 强化学习:Reinforcement Learning (RL)
- 迁移学习:Transfer Learning
四、任务类型
- 分类:Classification
- 回归:Regression
- 聚类:Clustering
- 降维:Dimensionality Reduction
- 生成:Generation
五、经典算法
- 线性回归:Linear Regression
- 逻辑回归:Logistic Regression
- K 近邻:KNN
- 决策树:Decision Tree
- 随机森林:Random Forest
- 支持向量机:SVM
- 朴素贝叶斯:Naive Bayes
- K-Means:K-Means
- 主成分分析:PCA
六、深度学习
- 神经网络:Neural Network
- 卷积神经网络:CNN
- 循环神经网络:RNN
- Transformer:Transformer
- 激活函数:Activation Function
- 前向传播:Forward Propagation
- 反向传播:Backpropagation
- 梯度下降:Gradient Descent
- 学习率:Learning Rate
- 批次:Batch
- 迭代轮数:Epoch
七、损失与优化
- 损失函数:Loss Function
- 均方误差:MSE
- 交叉熵:Cross Entropy
- 梯度:Gradient
- 正则化:Regularization
- 早停:Early Stopping
八、评估指标
- 准确率:Accuracy
- 精确率:Precision
- 召回率:Recall
- F1 分数:F1 Score
- 混淆矩阵:Confusion Matrix
- 过拟合:Overfitting
- 欠拟合:Underfitting
- 泛化能力:Generalization
第二部分 大模型发展及关键技术
一、基础与范式
- 大语言模型 -- Large Language Model (LLM)
- 基础模型 -- Foundation Model
- 预训练 -- Pre-training
- 微调 -- Fine-tuning
- 指令微调 -- Instruction Tuning
- 对齐 -- Alignment
二、架构与核心模块
- Transformer -- Transformer
- 编码器 -- Encoder
- 解码器 -- Decoder
- 自注意力 -- Self-Attention
- 多头注意力 -- Multi-Head Attention
- 位置编码 -- Positional Encoding
三、训练与优化
- 上下文窗口 -- Context Window
- 参数量 -- Parameter Count
- token -- 令牌 / 词元
- 分词器 -- Tokenizer
- 批量大小 -- Batch Size
- 学习率 -- Learning Rate
- 优化器 -- Optimizer
- 分布式训练 -- Distributed Training
四、高效与工程
- 稀疏注意力 -- Sparse Attention
- 量化 -- Quantization
- LoRA -- 低秩适配
- 推理 -- Inference
- 显存 -- GPU Memory / VRAM
五、能力与评估
- 涌现能力 -- Emergent Abilities
- 思维链 -- Chain-of-Thought (CoT)
- 少样本学习 -- Few-shot Learning
- 零样本学习 -- Zero-shot Learning
- 幻觉 -- Hallucination
六、对齐与安全
- RLHF -- 基于人类反馈的强化学习
- DPO -- 直接偏好优化
- 红队测试 -- Red Teaming
- 安全对齐 -- Safety Alignment
七、多模态与扩展
- 多模态大模型 -- Multimodal LLM
- 图文对齐 -- Vision-Language Alignment
- RAG -- 检索增强生成
- Agent -- 智能体
- 工具使用 -- Tool Use
- 长文本理解 -- Long-Context Understanding
关键技术应用场景:
第一部分 提示工程(prompt)
一、核心基础
1、提示工程 -- Prompt Engineering
2、提示 / 提示词 -- Prompt
3、指令 -- Instruction
4、上下文 -- Context
5、输入提示 -- Input Prompt
6、输出响应 -- Output Response
7、提示模板 -- Prompt Template
二、提示设计与结构
1、少样本提示 -- Few-shot Prompting
2、零样本提示 -- Zero-shot Prompting
3、思维链提示 -- Chain-of-Thought (CoT) Prompting
4、逐步提示 -- Step-by-Step Prompting
5、角色提示 -- Role Prompting
6、约束提示 -- Constraint Prompting
7、示例演示 -- Demonstration (Few-shot 中的示例)
8、格式指定 -- Format Specification
9、任务描述 -- Task Description
三、进阶优化技巧
1、提示调优 -- Prompt Tuning
2、自动提示工程 -- Automatic Prompt Engineering (APE)
3、提示增强 -- Prompt Enhancement
4、提示精炼 -- Prompt Refinement
5、反提示 -- Anti-Prompt (避免模型生成特定内容)
6、元提示 -- Meta-Prompt (指导模型生成提示)
7、多阶段提示 -- Multi-Stage Prompting
8、提示链 -- Prompt Chaining
四、落地应用与评估
1、上下文窗口 -- Context Window
2、提示长度 -- Prompt Length
3、响应一致性 -- Response Consistency
4、提示鲁棒性 -- Prompt Robustness
5、提示压缩 -- Prompt Compression
6、领域适配提示 -- Domain-Adapted Prompt
7、提示模板库 -- Prompt Template Library
8、提示效果评估 -- Prompt Evaluation
第二部分 检索增强生成-RAG(Retrieval-Augmented Generation)
一、核心基础
1、检索增强生成 -- Retrieval-Augmented Generation (RAG)
2、大语言模型 -- Large Language Model (LLM)
3、知识库 -- Knowledge Base
4、向量数据库 -- Vector Database
5、嵌入 / 向量嵌入 -- Embedding / Vector Embedding
二、数据处理环节
1、文档加载 -- Document Loading
2、文档分割 / 分块 -- Document Splitting / Chunking
3、文本预处理 -- Text Preprocessing
4、元数据 -- Metadata
5、文档索引 -- Document Indexing
三、检索核心环节
1、检索 -- Retrieval
2、相似性搜索 -- Similarity Search
3、余弦相似度 -- Cosine Similarity
4、向量检索 -- Vector Search
5、混合检索 -- Hybrid Search(文本检索 + 向量检索)
6、召回率 -- Recall
7、精确率 -- Precision
8、Top-K 检索 -- Top-K Retrieval
四、生成与优化环节
1、提示模板 -- Prompt Template
2、上下文增强 -- Context Enhancement
3、答案生成 -- Answer Generation
4、引用溯源 -- Citation / Source Attribution
5、去重 -- Deduplication
6、过滤 -- Filtering
7、重排 -- Reranking
8、幻觉抑制 -- Hallucination Mitigation
9、检索增强提示 -- Retrieval-Augmented Prompting
五、工程落地
1、嵌入模型 -- Embedding Model
2、检索器 -- Retriever
3、生成器 -- Generator
4、管道 / 工作流 -- Pipeline / Workflow
5、批量处理 -- Batch Processing
6、增量更新 -- Incremental Update
7、缓存 -- Caching
第三部分 Agent
一、大模型应用基础
- 大语言模型 -- Large Language Model (LLM)
- 提示词 / 提示工程 -- Prompt / Prompt Engineering
- 上下文窗口 -- Context Window
- 上下文管理 -- Context Management
- 检索增强生成 -- Retrieval-Augmented Generation (RAG)
- 知识库 -- Knowledge Base
- 向量数据库 -- Vector Database
- 微调 / 指令微调 -- Fine-tuning / Instruction Tuning
- 幻觉 -- Hallucination
- 插件 / 工具调用 -- Plugin / Tool Calling
二、Agent 核心概念
- 智能体 -- Agent
- 自主智能体 -- Autonomous Agent
- 多智能体系统 -- Multi-Agent System (MAS)
- 规划 -- Planning
- 推理 -- Reasoning
- 记忆 -- Memory
- 执行器 -- Executor
- 观测 -- Observation
- 行动 -- Action
- 目标导向 -- Goal-Oriented
三、Agent 架构与流程
- 思维链 -- Chain-of-Thought (CoT)
- 反思 / 自我修正 -- Reflection / Self-Correction
- 工具使用 -- Tool Use
- 函数调用 -- Function Calling
- 任务分解 -- Task Decomposition
- 状态跟踪 -- State Tracking
- 工作流 -- Workflow
- 循环执行 -- Loop / Iteration
四、记忆与上下文
- 短期记忆 -- Short-term Memory
- 长期记忆 -- Long-term Memory
- 情景记忆 -- Episodic Memory
- 语义记忆 -- Semantic Memory
- 记忆检索 -- Memory Retrieval
- 记忆摘要 -- Memory Summarization
五、交互与协同
- 人机交互 -- Human-Agent Interaction
- 智能体协作 -- Agent Collaboration
- 对话管理 -- Dialogue Management
- 意图识别 -- Intent Recognition
- 决策机制 -- Decision Making
- 反馈闭环 -- Feedback Loop
六、部署与工程
- 智能体框架 -- Agent Framework
- 流水线 -- Pipeline
- 中间件 -- Middleware
- API 调用 -- API Call
- 流式输出 -- Streaming Output
- 并发控制 -- Concurrency Control
- 可靠性 -- Reliability
- 可解释性 -- Interpretability
七、安全与对齐
- 对齐 -- Alignment
- 红队测试 -- Red Teaming
- 安全护栏 -- Safety Guardrails
- 权限控制 -- Permission Control