一、基础核心概念
- 人工智能 (AI - Artificial Intelligence)
- 解释:让机器模仿人类的智能行为(如学习、推理、感知、决策)的科学技术。
- 机器学习 (ML - Machine Learning)
- 解释:AI的一个子领域。不通过明确编程,而是让算法从数据中自动学习规律和模式。
- 深度学习 (DL - Deep Learning)
- 解释:机器学习的进阶方法,使用多层神经网络(模仿人脑结构)来自动提取数据特征,尤其擅长图像、语音等复杂任务。
- 数据挖掘 (Data Mining)
- 解释:从海量数据中找出隐藏的、有用的模式和关联,常与机器学习结合使用。
- 大语言模型 (LLM - Large Language Model)
- 解释:使用海量文本和代码训练的超大规模深度学习模型(如ChatGPT),能理解和生成自然语言。
二、模型与算法
- 神经网络 (Neural Network)
- 解释:由大量相互连接的节点(模拟神经元)组成的计算系统,通过调整节点间的连接权重来学习。
- 监督学习 (Supervised Learning)
- 解释:使用带标签的数据(输入-输出对)训练模型,让模型学会将新输入映射到正确输出(如分类、回归)。
- 无监督学习 (Unsupervised Learning)
- 解释:使用无标签数据,让模型自己发现数据中的隐藏结构或分组(如聚类、降维)。
- 强化学习 (RL - Reinforcement Learning)
- 解释:通过"试错"和奖励/惩罚机制训练智能体(Agent),让它在环境中学习最优策略(如AlphaGo)。
- 生成对抗网络 (GAN - Generative Adversarial Network)
- 解释:由两个神经网络(生成器制造假数据,判别器判断真伪)互相博弈,最终生成极其逼真的新内容(如图片、视频)。
- Transformer
- 解释:一种革命性的神经网络架构,基于"自注意力机制",能高效处理序列数据,是现代大语言模型的基石(BERT、GPT等的基础)。
- 扩散模型 (Diffusion Model)
- 解释:通过逐步给数据添加噪声,再学习逆向过程(去噪)来生成新数据的方法,是目前主流AI绘画(如Stable Diffusion)的核心技术。
三、训练与优化
- 训练集 / 测试集 (Training Set / Test Set)
- 解释:训练集用来教模型学习;测试集用来评估模型在未见过的数据上的表现。
- 过拟合 (Overfitting)
- 解释:模型在训练数据上表现完美,但对新数据预测很差(相当于死记硬背,没学到通用规律)。
- 欠拟合 (Underfitting)
- 解释:模型连训练数据的基本规律都没学好,表现不佳。
- 梯度下降 (Gradient Descent)
- 解释:一种优化算法,通过计算损失函数的斜率,反复微调模型参数,使模型的预测误差最小化。
- 反向传播 (Backpropagation)
- 解释:在神经网络中,将最终输出的误差反向传递回各层,计算每个参数对误差的贡献,从而更新参数。
- 损失函数 (Loss Function)
- 解释:衡量模型预测值与真实值之间差异的"评分表",训练的目标就是让这个损失值尽可能小。
- 学习率 (Learning Rate)
- 解释:梯度下降中每次调整参数的步长大小。过大容易错过最优解,过小训练太慢。
四、数据与特征
- 特征 (Feature)
- 解释:用于预测的输入变量。例如,预测房价时的"面积"、"卧室数量"就是特征。
- 特征工程 (Feature Engineering)
- 解释:将原始数据加工成更能体现问题本质的特征的过程,对传统机器学习效果影响巨大(深度学习可自动化此过程)。
- 标注数据 (Labeled Data)
- 解释:已经标明正确答案的数据(如一张图片被标记为"猫"),用于监督学习。
- 嵌入 (Embedding)
- 解释:将文字、图像等离散的符号,映射到连续的数值向量空间。相似概念的向量在空间中也彼此接近。
五、应用技术领域
- 计算机视觉 (CV - Computer Vision)
- 解释:让计算机理解和解释图像、视频内容的技术,包括图像识别、目标检测、人脸识别等。
- 自然语言处理 (NLP - Natural Language Processing)
- 解释:让计算机理解、解释和生成人类语言的技术,包括翻译、情感分析、问答系统等。
- 语音识别 (Speech Recognition)
- 解释:将人类的语音信号转换为文本的技术(如语音助手、字幕生成)。
- 推荐系统 (Recommender System)
- 解释:根据用户的历史行为和偏好,主动推荐可能感兴趣的商品、视频或内容(如电商、短视频App)。
- 机器人学 (Robotics)
- 解释:结合AI进行感知、规划和控制的机器人设计与应用,如自动驾驶机器人、工业机械臂。
六、生成式AI特有名词
- 提示词 / 提示工程 (Prompt / Prompt Engineering)
- 解释:给AI模型(如ChatGPT、Midjourney)的输入指令。设计有效的提示词以获取理想输出的技术被称为提示工程。
- 幻觉 (Hallucination)
- 解释:大语言模型生成看似合理但实际上是虚构或错误的信息,这是当前生成式AI的常见缺陷。
- 涌现能力 (Emergent Ability)
- 解释:当模型规模(参数量、数据量)超过某个阈值后,突然出现的、小模型不具备的复杂能力(如上下文学习、推理链)。
- RAG (Retrieval-Augmented Generation)
- 解释:检索增强生成。在让大模型回答前,先从外部知识库检索相关文档,然后将这些文档和问题一起交给模型生成答案,可有效减少幻觉。
七、伦理与风险
- 算法偏见 (Algorithm Bias)
- 解释:由于训练数据本身包含社会偏见或数据不均衡,导致模型产生对特定群体的不公平、歧视性结果。
- 可解释性 (XAI - Explainable AI)
- 解释:研究如何让AI模型的内部决策过程变得能被人类理解和信任,避免"黑箱"效应。
- 对齐问题 (Alignment Problem)
- 解释:如何确保AI系统的目标、行为和人类的真实价值观、长远利益保持一致,避免产生不良后果。
- 强人工智能 / 通用人工智能 (AGI - Artificial General Intelligence)
- 解释:能够理解、学习和应用其智能解决任何问题的AI,像人类一样具有通用认知能力。目前尚未实现。
这个列表涵盖了从基础到前沿的主要术语,如果不全可以补充。