机器学习期末速成

文章参考自B站机器学习期末速成课

本文仅作者个人复习使用

一、机器学习分类

聚类和分类的区别:

分类:一开始就知道有哪些类别

聚类:一开始不知道有哪些类别

损失函数:简单来说就是你预测出来的结果和真实值的差距。

0-1损失函数:一般做二分类问题

数据特征工程,相当于对原始数据进行一定的清理和提纯。

二、逻辑回归







sigmoid函数会让输出值在0-1之间


求参数,比如w和b,一般用梯度下降算法。

三、决策树










信息熵和信息增益描述数据的混乱程度

Gini系数则是描述数据的纯度

两者都是越小越好

四、集成学习算法

















五、支持向量机

两个类别边缘上的点叫支持向量

硬间隔:完全分类准确

软间隔:存在分类错误的情况






六、聚类









七、特征工程和指标












相关推荐
乐分启航7 小时前
SliMamba:十余K参数量刷新SOTA!高光谱分类的“降维打击“来了
java·人工智能·深度学习·算法·机器学习·分类·数据挖掘
Theodore_10229 小时前
深度学习(11):偏差与方差诊断、学习曲线
人工智能·笔记·深度学习·神经网络·机器学习·计算机视觉
Theodore_102211 小时前
深度学习(12)正则化线性回归中的偏差与方差调试
人工智能·深度学习·算法·机器学习·线性回归
链巨人11 小时前
理解L-平滑 (L-smoothness)和\mu-强凸 (\mu-strong convexity)并以此假设来证明梯度下降方法的收敛性
人工智能·机器学习
Zero14 小时前
机器学习概率论与统计学--(2)统计学基础
机器学习·概率论·统计学
做科研的周师兄14 小时前
巴音河中下游灌溉草地空间分布数据集(2020年)
大数据·人工智能·算法·机器学习·数据挖掘·聚类
纤纡.14 小时前
矿物识别分类:8 种机器学习算法对比与实战(平均值填充数据集)
python·深度学习·算法·机器学习
链巨人16 小时前
海森矩阵(Hessian矩阵)及其应用
线性代数·机器学习·矩阵·概率论
城俊BLOG16 小时前
已落地量产的自动驾驶VLA技术解析:从“感知智能“到“认知智能“的工程化突围
人工智能·机器学习·自动驾驶
云和数据.ChenGuang16 小时前
chromadb为什么需要模拟数据运行
人工智能·神经网络·目标检测·机器学习·计算机视觉