AI(人工智能) 领域常见的专业名词

一、基础核心概念

  1. 人工智能 (AI - Artificial Intelligence)
    • 解释:让机器模仿人类的智能行为(如学习、推理、感知、决策)的科学技术。
  2. 机器学习 (ML - Machine Learning)
    • 解释:AI的一个子领域。不通过明确编程,而是让算法从数据中自动学习规律和模式。
  3. 深度学习 (DL - Deep Learning)
    • 解释:机器学习的进阶方法,使用多层神经网络(模仿人脑结构)来自动提取数据特征,尤其擅长图像、语音等复杂任务。
  4. 数据挖掘 (Data Mining)
    • 解释:从海量数据中找出隐藏的、有用的模式和关联,常与机器学习结合使用。
  5. 大语言模型 (LLM - Large Language Model)
    • 解释:使用海量文本和代码训练的超大规模深度学习模型(如ChatGPT),能理解和生成自然语言。

二、模型与算法

  1. 神经网络 (Neural Network)
    • 解释:由大量相互连接的节点(模拟神经元)组成的计算系统,通过调整节点间的连接权重来学习。
  2. 监督学习 (Supervised Learning)
    • 解释:使用带标签的数据(输入-输出对)训练模型,让模型学会将新输入映射到正确输出(如分类、回归)。
  3. 无监督学习 (Unsupervised Learning)
    • 解释:使用无标签数据,让模型自己发现数据中的隐藏结构或分组(如聚类、降维)。
  4. 强化学习 (RL - Reinforcement Learning)
    • 解释:通过"试错"和奖励/惩罚机制训练智能体(Agent),让它在环境中学习最优策略(如AlphaGo)。
  5. 生成对抗网络 (GAN - Generative Adversarial Network)
    • 解释:由两个神经网络(生成器制造假数据,判别器判断真伪)互相博弈,最终生成极其逼真的新内容(如图片、视频)。
  6. Transformer
    • 解释:一种革命性的神经网络架构,基于"自注意力机制",能高效处理序列数据,是现代大语言模型的基石(BERT、GPT等的基础)。
  7. 扩散模型 (Diffusion Model)
    • 解释:通过逐步给数据添加噪声,再学习逆向过程(去噪)来生成新数据的方法,是目前主流AI绘画(如Stable Diffusion)的核心技术。

三、训练与优化

  1. 训练集 / 测试集 (Training Set / Test Set)
    • 解释:训练集用来教模型学习;测试集用来评估模型在未见过的数据上的表现。
  2. 过拟合 (Overfitting)
    • 解释:模型在训练数据上表现完美,但对新数据预测很差(相当于死记硬背,没学到通用规律)。
  3. 欠拟合 (Underfitting)
    • 解释:模型连训练数据的基本规律都没学好,表现不佳。
  4. 梯度下降 (Gradient Descent)
    • 解释:一种优化算法,通过计算损失函数的斜率,反复微调模型参数,使模型的预测误差最小化。
  5. 反向传播 (Backpropagation)
    • 解释:在神经网络中,将最终输出的误差反向传递回各层,计算每个参数对误差的贡献,从而更新参数。
  6. 损失函数 (Loss Function)
    • 解释:衡量模型预测值与真实值之间差异的"评分表",训练的目标就是让这个损失值尽可能小。
  7. 学习率 (Learning Rate)
    • 解释:梯度下降中每次调整参数的步长大小。过大容易错过最优解,过小训练太慢。

四、数据与特征

  1. 特征 (Feature)
    • 解释:用于预测的输入变量。例如,预测房价时的"面积"、"卧室数量"就是特征。
  2. 特征工程 (Feature Engineering)
    • 解释:将原始数据加工成更能体现问题本质的特征的过程,对传统机器学习效果影响巨大(深度学习可自动化此过程)。
  3. 标注数据 (Labeled Data)
    • 解释:已经标明正确答案的数据(如一张图片被标记为"猫"),用于监督学习。
  4. 嵌入 (Embedding)
    • 解释:将文字、图像等离散的符号,映射到连续的数值向量空间。相似概念的向量在空间中也彼此接近。

五、应用技术领域

  1. 计算机视觉 (CV - Computer Vision)
    • 解释:让计算机理解和解释图像、视频内容的技术,包括图像识别、目标检测、人脸识别等。
  2. 自然语言处理 (NLP - Natural Language Processing)
    • 解释:让计算机理解、解释和生成人类语言的技术,包括翻译、情感分析、问答系统等。
  3. 语音识别 (Speech Recognition)
    • 解释:将人类的语音信号转换为文本的技术(如语音助手、字幕生成)。
  4. 推荐系统 (Recommender System)
    • 解释:根据用户的历史行为和偏好,主动推荐可能感兴趣的商品、视频或内容(如电商、短视频App)。
  5. 机器人学 (Robotics)
    • 解释:结合AI进行感知、规划和控制的机器人设计与应用,如自动驾驶机器人、工业机械臂。

六、生成式AI特有名词

  1. 提示词 / 提示工程 (Prompt / Prompt Engineering)
    • 解释:给AI模型(如ChatGPT、Midjourney)的输入指令。设计有效的提示词以获取理想输出的技术被称为提示工程。
  2. 幻觉 (Hallucination)
    • 解释:大语言模型生成看似合理但实际上是虚构或错误的信息,这是当前生成式AI的常见缺陷。
  3. 涌现能力 (Emergent Ability)
    • 解释:当模型规模(参数量、数据量)超过某个阈值后,突然出现的、小模型不具备的复杂能力(如上下文学习、推理链)。
  4. RAG (Retrieval-Augmented Generation)
    • 解释:检索增强生成。在让大模型回答前,先从外部知识库检索相关文档,然后将这些文档和问题一起交给模型生成答案,可有效减少幻觉。

七、伦理与风险

  1. 算法偏见 (Algorithm Bias)
    • 解释:由于训练数据本身包含社会偏见或数据不均衡,导致模型产生对特定群体的不公平、歧视性结果。
  2. 可解释性 (XAI - Explainable AI)
    • 解释:研究如何让AI模型的内部决策过程变得能被人类理解和信任,避免"黑箱"效应。
  3. 对齐问题 (Alignment Problem)
    • 解释:如何确保AI系统的目标、行为和人类的真实价值观、长远利益保持一致,避免产生不良后果。
  4. 强人工智能 / 通用人工智能 (AGI - Artificial General Intelligence)
    • 解释:能够理解、学习和应用其智能解决任何问题的AI,像人类一样具有通用认知能力。目前尚未实现。

这个列表涵盖了从基础到前沿的主要术语,如果不全可以补充。

相关推荐
梦梦代码精6 小时前
为什么这个开源的AI平台会火?有点东西。。。
人工智能·算法·机器学习·docker·开源
大模型真好玩6 小时前
智能体从入门到精通:6个必学GitHub开源项目
人工智能·agent·deepseek
源图客6 小时前
Aitoearn:OPC(一人公司)的AI内容智能体
人工智能·dreamweaver
逸模7 小时前
AI+BIM 重构连锁公装新范式 逸模打造数字化营建核心底座
大数据·人工智能·笔记·其他·信息可视化·重构
phltxy7 小时前
MCP 从协议到 Spring AI 实战
人工智能·spring·oracle
Sirius Wu7 小时前
Agentic端到端&分离式RL技术建设
人工智能·深度学习·机器学习·caffe
AI导出鸭PC端7 小时前
智谱清言怎么生成word文档?AI导出鸭终结乱码烦恼
人工智能·ai·c#·word·豆包·ai导出鸭
格桑阿sir7 小时前
17-大模型智能体开发工程师:深入学习Agent记忆系统
人工智能·记忆存储·记忆系统·agent记忆·嵌入式数据库·agent进化·记忆检索
数据仓库搬砖人7 小时前
LangGraph 原理深度解析:为什么它是目前最适合构建 Agent 的框架
人工智能
孟陬7 小时前
国外技术周刊 #139:LLM 正在杀死程序员的「懒惰美德」
前端·人工智能·后端