机器学习深度学习beginning1

1.机器学习:就是让机器具备找函式(寻找规律)的能力。

2.不同类型的函式:

回归:函数输出一个数值,输入可能是多种能够判断输出结果的指标,预测连续数值。

分类:给定选项类,函式输出正确的选项,预测离散类型。

如何找到函式:a.假设函数y(y就是模型,可带有未知参数);b.根据训练数据定义损失L(判断模型的好坏,实际也是一个函数);c.优化(Optimiztion),找最佳的y中的未知参数,使得损失最小。

MAE:均值绝对误差,e=|y-y'|(y'为预测值,y为真实值)

MSE:均方差,e=(y-y')²(y'为预测值,y为真实值)
:学习率,寻找未知参数的最佳值时用到

3.模型分为:线性模型、非线性模型

liner function:(会具有模型偏差)

Sigmoid function:(w改变斜率、b改变左右位置、c改变上下高度)

Rectified Liner Unit(RLU)

4.深度学习:由多个神经元组成神经层,从而构成深度神经网络的机器学习。

神经元 (Neuron):基本计算单元,接收输入,加权求和,通过激活函数输出(相当于过滤器)。

层:输入出、隐藏层(进行特征提取和变换)、输出层。

激活函数:让网络拟合出复杂的曲线。(ReLU、Sigmoid)

5.常见的网络架构:

CNN(卷积神经网络):处理网络状数据。(图像)

RNN(循环神经网络):处理序列数据,具有"记忆"特点。(文本)

GAN(生成对抗网络):生成内容。

6.(AI生成)

术语 解释 通俗理解
特征 (Feature) 输入数据的属性 比如预测房价,特征就是"面积"、"地段"、"房龄"。
标签 (Label) 想要预测的目标值 比如预测房价,标签就是具体的"价格"。
模型 (Model) 经过训练后的算法文件 就像学生学完知识后的大脑,可以用来做题。
训练集/测试集 用于训练和验证的数据划分 训练集是"课本",测试集是"期末考试题"。
损失函数 (Loss) 衡量预测值与真实值差距的公式 考试扣了多少分,分数越低越好。
优化器 (Optimizer) 用于更新模型参数的算法 老师根据错题指导学生如何改进学习方法(如 SGD, Adam)。
梯度下降 (Gradient Descent) 寻找损失函数最小值的方法 下山的过程,一步步往坡度最陡的地方走,直到谷底。
过拟合 (Overfitting) 模型在训练集表现好,测试集表现差 "死记硬背",课本题都会,考试换个题就不会了。
欠拟合 (Underfitting) 模型在训练集和测试集表现都差 "没学懂",课本题都不会。
超参数 (Hyperparameter) 训练前人工设定的参数 如学习率、网络层数(类似于"每天学几小时")。

7.训练损失

8.过拟合

表现:训练集准确率很高,但测试集/验证集准确率很低)。

本质:模型太复杂,记住了数据中的"噪声"而不是"规律"。

解决方法:

增加训练数据

数据增强(没有足够的数据,需要对原数据进行变换)

给模型进行限制:减少参数、使用共享参数、去掉不相关或冗余的特征、早停法(early stopping)、正则化技术(Regularization)、Dropout。

9.欠拟合

表现:训练集准确率低,测试集/验证集准确率很低。

本质:模型太简单。

解决方法:

增加模型复杂度

减少正则化

增加新特征

增加训练时间(epoch)

注:所有的机器学习深度学习系列的博客都来自于B站

相关推荐
生信碱移5 小时前
PACells:这个方法可以鉴定疾病/预后相关的重要细胞亚群,作者提供的代码流程可以学习起来了,甚至兼容转录组与 ATAC 两种数据类型!
人工智能·学习·算法·机器学习·数据挖掘·数据分析·r语言
哥布林学者6 小时前
深度学习进阶(十三)可变形卷积 DCN
机器学习·ai
AI自动化工坊8 小时前
Hugging Face ml-intern技术深度解析:AI机器学习工程师的工程实践
人工智能·机器学习·huggingface·ml-intern·ai机器学习
AI手记叨叨9 小时前
机器学习可解释性工具SHAP
机器学习·shap
高洁0110 小时前
大模型部署资源不足?轻量化部署解决方案
python·深度学习·机器学习·数据挖掘·transformer
折哥的程序人生 · 物流技术专研11 小时前
从“卡死”到“秒过”:WMS销售数据跨库回填的极限优化之旅
数据库·机器学习·oracle
我是发哥哈13 小时前
主流AI框架生产环境性能对比:5大关键维度深度评测
大数据·人工智能·学习·机器学习·ai·chatgpt·ai-native
雷帝木木13 小时前
Python 并发编程的高级技巧与性能优化
人工智能·python·深度学习·机器学习
折哥的程序人生 · 物流技术专研13 小时前
WMS智能调度实战:构建机器学习特征表的完整指南
人工智能·机器学习
AI科技星15 小时前
人类首张【全域数学公理体系】黑洞内部结构图—基于「0-1-∞」三元本源的全维深度解析
人工智能·算法·机器学习·数学建模·数据挖掘·量子计算