(统计学习方法|李航)第一章统计学习方法概论七八九十节——生成模型与判别模型,分类问题,标注问题,回归问题

目录

一,生成模型与判别模型

二,分类问题

三,标注问题

四,回归问题


一,生成模型与判别模型

P(X,Y)是联合概率分布

只要是出现联合概率分布,就一定是生成模型

这里的P(Y|X)表示的是以X为条件Y的概率分布

隐马尔可夫模型时间上是一个时间序列的生成模型

判别方法就是直接去求概率

生成模型VS判别模型

  • 生成模型需要大量的数据将小狗和大象进行分类
  • 判别模型只需要利用差别去分类就可以了

比如说:

可以用特征鼻子的长度去判断是大象还是小狗------生成模型

需要收集耳朵,尾巴,脚等一系列特征去判断是大象还是小狗------判别模型

监督学习的应用:分类问题,标注问题,回归问题

二,分类问题

当输入变量和输出变量

  • 均为离散变量为分类问题
  • 均为变量序列为标注问题
  • 均为连续变量为回归问题

输出的类别(class)

评估分类器性能的指标一般是分类准确率

其定义是:对于给定的测试数据集,分类器正确分类的样本数和总样本数之比,也就是损失函数是0-1损失时候,测试数据集上的准确率。

true positive

false negative

前面的TF(代表的是预测正确与否)

后面的PN(代表的是预测数是正类数还是负类数)

画图更好记:
background:

根据特征值预测是否会被女孩子喜欢,

  • 结果中预测正确的就是predict(精确率)(预测正确里面有多少是正确的)
  • 在被女孩子喜欢的人中被预测出来的就是true(召回率)(所有正确的人里面召回了多少)

三,标注问题

标注问题也是一个监督学习问题。可以认为标记问题是分类问题的一个推广。

标注问题的输入是一个观测序列,输出的是一个标记序列或状态序列。也就是说,分类问题的输出是一个值,而标注问题输出是一个向量,向量的每个值属于一种标记类型。

标注常用的机器学习方法有:隐性马尔可夫模型、条件随机场。

模型可以是条件概率的形式也可以是决策函数的形式

  • 输入与输出均为22个序列
  • 名词标注为E,形容词标注为B,其他标注为O

四,回归问题

回归用于预测输入变量和输出变量之间的关系:

特别是当输入变量的值发生变化时,输出变量的值随之发生的变化。

回归模型正是表示从输入变量到输出变量之间映射的函数。

回归问题的学习等价于函数拟合:

  • 选择一条函数曲线使得很好地拟合已知数据且很好地拟合已知数据且很好地预测未知数据。
  • 回归问题按照输入变量的个数,分为一元回归和多元回归;
  • 按照输入变量和输出变量之间关系的类型即模型的类型,分为线性回归和非线性回归。

回归学习最常用的损失函数是平方损失函数,在此情况下,回归问题可以用最小二乘法求解。

相关推荐
小龙报2 天前
《算法通关指南数据结构和算法篇(2)--- 链表专题》
c语言·数据结构·c++·算法·链表·学习方法·visual studio
小龙报3 天前
《算法通关指南:数据结构和算法篇 --- 链表相关算法题》--- 1. 队列安排,2.约瑟夫问题
c语言·数据结构·c++·算法·创业创新·学习方法·visual studio
qiyongwork4 天前
学习方法的总结和应用实例
学习方法·学习方法实践
我命由我123454 天前
Excel - Excel 找回意外关闭的未保存的文档
学习·职场和发展·excel·求职招聘·职场发展·运维开发·学习方法
一起养小猫4 天前
《半小时漫画计算机》读后感:从入门到构建知识体系
职场和发展·学习方法·改行学it
贝塔实验室5 天前
Altium Designer 6.0 初学教程-如何从原理图及PCB 中生成网表并且实现网表的加载
fpga开发·硬件架构·硬件工程·学习方法·射频工程·基带工程·pcb工艺
大佬,救命!!!6 天前
C++函数式策略模式代码练习
开发语言·c++·学习笔记·学习方法·策略模式·迭代加深·多文件编译
松涛和鸣6 天前
14、C 语言进阶:函数指针、typedef、二级指针、const 指针
c语言·开发语言·算法·排序算法·学习方法
go_bai6 天前
Linux-线程2
linux·c++·经验分享·笔记·学习方法
布丁写代码8 天前
GESP C++ 一级 2025年09月真题解析
开发语言·c++·程序人生·学习方法