机器学习基础入门(1)

最近也在努力的想要学习些机器学习的知识,目前正在了解各个概念及术语,下面就把学习到的概念都列出来。

人工智能 (AI) Artificial intelligence

人工智能生成内容(AIGC)

机器学习(ML) Machine Learning

是人工智能 (AI) 的一个分支,专注于使用数据和算法来模仿人类的学习方式,从而随着时间的推移逐渐提高准确性

Machine Learning 共分为四类,分别是:监督式非监督式半监督式学习强化学习

深度学习(DL)Deep Learning

  1. 深度学习是机器学习的一个分支(最重要的分支)
  2. 机器学习是人工智能的一个分支

**自然语言处理(NLP)**Natural Language Processing

语言模型(LM)Language Model

大预言模型(LLM)Large Language Model

小语言模型(SLM)Small Language Model

神经网络语言模型(NNLN)Neural Network Language Model

深度学习算法:

卷积神经网络(CNN)Convolutional Neural Network

参考资料: CNN

循环神经网络(RNN)

参考资料: RNN

生成式对抗网络(GAN)

深度强化学习 (RL)

Transformer架构

Transformer架构是大型语言模型背后的核心架构。它采用了自注意力机制来捕捉输入序列中的长距离依赖关系,避免了传统循环神经网络(RNN)中存在的梯度消失问题。Transformer包括编码器和解码器两个部分,其中编码器用于将输入序列编码为隐藏表示,而解码器则用于根据编码器的输出生成目标序列。

自注意力机制(Self-Attention)

自注意力机制是Transformer架构的核心之一。它允许模型在处理每个输入位置时都可以关注到其他位置的信息,并且可以动态地调整不同位置的重要性。通过计算每个位置与其他位置的相关性,自注意力机制可以有效地捕捉序列中的语义关系,从而提高模型在自然语言处理任务中的性能。

微调(Fine-tuning)

在预训练模型的基础上,通过在特定任务上进行少量训练以调整模型参数,以适应特定任务的需求。

泛化(Generalization)

模型在未见过的数据上表现良好的能力,避免过拟合于训练数据。

文本转语音(TTS)Text To Speech

将书面文字转换为可听见的语音的技术

语音转文字(STT)Speech To Text

算力单位:

OPS(operations per second)

每秒处理次数,通常是默认对INT8整数型数据的处理次数(INT8省略不写)

TOPS(Tera Operations Per Second)

GPU每秒可以执行的深度学习推理操作次数,1TOPS=处理器每秒钟可进行一万亿次(10^12)操作。

FLOP S **(**Floating point number operations per second)

每秒处理浮点数次数,加上FL后FLOPS指的是对FP32浮点数的处理次数

TFLOPS ( Tera Floating point number operations per second**)**

每秒处理浮点数的万亿次数

FLOP s (Floating point number operations)

模型参数的处理次数,注意s是小写

MOPS (Million Operation Per Second) 一百万次(10^6) 兆;百万

GOPS (Giga Operations Per Second) 十亿次 (10^9) 千兆;十亿(billion,B)

TOPS (Tera Operations Per Second) 一万亿次 (10^12) 兆兆

换算:

1 TOPS = 10^12 FLOPS

1 GOPS = 10^9 FLOPS

1 MOPS = 10^6 FLOPS

相关推荐
谢眠3 分钟前
深度学习day3-自动微分
python·深度学习·机器学习
搏博12 分钟前
神经网络问题之一:梯度消失(Vanishing Gradient)
人工智能·机器学习
z千鑫12 分钟前
【人工智能】深入理解PyTorch:从0开始完整教程!全文注解
人工智能·pytorch·python·gpt·深度学习·ai编程
YRr YRr20 分钟前
深度学习:神经网络的搭建
人工智能·深度学习·神经网络
威桑23 分钟前
CMake + mingw + opencv
人工智能·opencv·计算机视觉
爱喝热水的呀哈喽26 分钟前
torch张量与函数表达式写法
人工智能·pytorch·深度学习
rellvera34 分钟前
【强化学习的数学原理】第02课-贝尔曼公式-笔记
笔记·机器学习
肥猪猪爸1 小时前
使用卡尔曼滤波器估计pybullet中的机器人位置
数据结构·人工智能·python·算法·机器人·卡尔曼滤波·pybullet
LZXCyrus1 小时前
【杂记】vLLM如何指定GPU单卡/多卡离线推理
人工智能·经验分享·python·深度学习·语言模型·llm·vllm
我感觉。2 小时前
【机器学习chp4】特征工程
人工智能·机器学习·主成分分析·特征工程