机器学习基础入门(1)

最近也在努力的想要学习些机器学习的知识,目前正在了解各个概念及术语,下面就把学习到的概念都列出来。

人工智能 (AI) Artificial intelligence

人工智能生成内容(AIGC)

机器学习(ML) Machine Learning

是人工智能 (AI) 的一个分支,专注于使用数据和算法来模仿人类的学习方式,从而随着时间的推移逐渐提高准确性

Machine Learning 共分为四类,分别是:监督式非监督式半监督式学习强化学习

深度学习(DL)Deep Learning

  1. 深度学习是机器学习的一个分支(最重要的分支)
  2. 机器学习是人工智能的一个分支

**自然语言处理(NLP)**Natural Language Processing

语言模型(LM)Language Model

大预言模型(LLM)Large Language Model

小语言模型(SLM)Small Language Model

神经网络语言模型(NNLN)Neural Network Language Model

深度学习算法:

卷积神经网络(CNN)Convolutional Neural Network

参考资料: CNN

循环神经网络(RNN)

参考资料: RNN

生成式对抗网络(GAN)

深度强化学习 (RL)

Transformer架构

Transformer架构是大型语言模型背后的核心架构。它采用了自注意力机制来捕捉输入序列中的长距离依赖关系,避免了传统循环神经网络(RNN)中存在的梯度消失问题。Transformer包括编码器和解码器两个部分,其中编码器用于将输入序列编码为隐藏表示,而解码器则用于根据编码器的输出生成目标序列。

自注意力机制(Self-Attention)

自注意力机制是Transformer架构的核心之一。它允许模型在处理每个输入位置时都可以关注到其他位置的信息,并且可以动态地调整不同位置的重要性。通过计算每个位置与其他位置的相关性,自注意力机制可以有效地捕捉序列中的语义关系,从而提高模型在自然语言处理任务中的性能。

微调(Fine-tuning)

在预训练模型的基础上,通过在特定任务上进行少量训练以调整模型参数,以适应特定任务的需求。

泛化(Generalization)

模型在未见过的数据上表现良好的能力,避免过拟合于训练数据。

文本转语音(TTS)Text To Speech

将书面文字转换为可听见的语音的技术

语音转文字(STT)Speech To Text

算力单位:

OPS(operations per second)

每秒处理次数,通常是默认对INT8整数型数据的处理次数(INT8省略不写)

TOPS(Tera Operations Per Second)

GPU每秒可以执行的深度学习推理操作次数,1TOPS=处理器每秒钟可进行一万亿次(10^12)操作。

FLOP S **(**Floating point number operations per second)

每秒处理浮点数次数,加上FL后FLOPS指的是对FP32浮点数的处理次数

TFLOPS ( Tera Floating point number operations per second**)**

每秒处理浮点数的万亿次数

FLOP s (Floating point number operations)

模型参数的处理次数,注意s是小写

MOPS (Million Operation Per Second) 一百万次(10^6) 兆;百万

GOPS (Giga Operations Per Second) 十亿次 (10^9) 千兆;十亿(billion,B)

TOPS (Tera Operations Per Second) 一万亿次 (10^12) 兆兆

换算:

1 TOPS = 10^12 FLOPS

1 GOPS = 10^9 FLOPS

1 MOPS = 10^6 FLOPS

相关推荐
AC赳赳老秦6 分钟前
OpenClaw email技能:批量发送邮件、自动回复,高效处理工作邮件
运维·人工智能·python·django·自动化·deepseek·openclaw
用户78245208077925 分钟前
一些容易混淆的点(个人记录)
人工智能
胡志辉27 分钟前
OpenClaw 教程:新 Mac 从 0 配到国产 AI、飞书微信和无人值守
人工智能·神经网络
机器之心39 分钟前
全球第一,13个SOTA!我们找到了龙虾界掌管GUI的神
人工智能·openai
AI问答工程师40 分钟前
Meta Muse Spark 的"思维压缩"到底是什么?我用 Python 复现了核心思路(附代码)
人工智能·python
机器之心1 小时前
大佬深度解析:Coding Agent的底层运行逻辑是什么?
人工智能·openai
爱吃的小肥羊1 小时前
Claude降智再被实锤!推理能力严重下滑,用户连夜跑路 Codex
人工智能·aigc·openai
Rabbit_QL1 小时前
【理论分析】信息熵的极值问题:什么时候最小?什么时候最大?
人工智能·深度学习
❀͜͡傀儡师1 小时前
Spring AI Alibaba vs. AgentScope:两个阿里AI框架,如何选择?
java·人工智能·spring
njsgcs1 小时前
MPNN框架 消息生成与聚合 (公式 1)
人工智能