吴恩达2022机器学习专项课程(一) 6.1 动机&第三周课后实验:Lab1使用逻辑回归进行分类

问题预览/关键词

  1. 回归和分类的区别?
  2. 逻辑回归的作用是?
  3. 什么是二分类问题?
  4. 二分类问题案例
  5. 如何表达二分类的结果?逻辑回归通常用哪种表达形式?
  6. 什么是正样本和负样本?
  7. 什么是阈值?
  8. 可视化线性回归解决二分类
  9. 线性回归面对二分类产生的问题
  10. 存储分类数据集
  11. 分类数据集的散点图
  12. 线性回归演示分类

笔记

1.回归和分类的区别

回归是从无限的值预测一个任意数字,而分类是从少量的值中确定一个数字。

2.逻辑回归的作用

逻辑回归用于解决二分类问题。

3.二分类问题

结果只有两种可能(分类),将预测的结果分为两种结果的一种。

4.二分类问题案例

邮件是否为垃圾?金融交易是否为欺诈?肿瘤是恶性还是良性?

5.二分类问题的结果表达

是或否,假或真,0或1,逻辑回归通常选择0或1表示预测结果y。

6.正样本和负样本

也是一结果种表达方式,更加术语化。在判定是否为垃圾邮件时,正常邮件为负样本,垃圾邮件为正样本。正负是相对于判定的事件而言,不代表好坏。

7.阈值:

一个数值,通常选择0.5,该数值用于判断分类问题的预测结果属于0还是属于1。

8.线性回归解决二分类问题

预测值小于0.5,预测即为良性,预测值大于等于0.5,预测即为恶性。

9.线性回归面对二分类的问题

如果新增一个训练样本,首先改变了分类方式(重新画条绿线),其次改变了我们之前预测的结论(阈值为0.5,小于0.5为良性,而此时两个小于0.5的数据点是恶性的)。

10.分类问题数据集的存储

y通常是0或1。

11.数据集散点图

  • 只有一个特征和y的分布,注意y的范围在0-1,如果是线性回归问题,y的范围不止0-1。
  • 两个特征与y之间的分布。-

12.线性回归演示分类

  • 使用线性回归对x_train和y_train分类,阈值选择0.5,模型可以很好的区分恶性和良性,此时y=0.24x+(-0.10)。
  • 如果增加数据,则线性回归模型的预测就会出错。

总结

面对二分类问题,如果使用线性回归解决,在阈值选对的情况下,可能有效果。但如果二分类的数据集较为复杂,则线性回归的预测就会出现偏差,此时应该使用逻辑回归解决二分类。我们不会直接靠预测结果分类,而是设置一个阈值,然后将预测结果和阈值比较,进而将预测结果分类。本节课程演示的全是一个特征的分类,吴恩达教授只是想通过简单的例子,让大家看到线性回归用于解决分类问题的局限性。

相关推荐
艾派森1 小时前
大数据分析案例-基于随机森林算法的智能手机价格预测模型
人工智能·python·随机森林·机器学习·数据挖掘
2 小时前
开源竞争-数据驱动成长-11/05-大专生的思考
人工智能·笔记·学习·算法·机器学习
忘梓.2 小时前
划界与分类的艺术:支持向量机(SVM)的深度解析
机器学习·支持向量机·分类
Chef_Chen2 小时前
从0开始机器学习--Day17--神经网络反向传播作业
python·神经网络·机器学习
MarkHD3 小时前
第十一天 线性代数基础
线性代数·决策树·机器学习
打羽毛球吗️3 小时前
机器学习中的两种主要思路:数据驱动与模型驱动
人工智能·机器学习
小馒头学python3 小时前
机器学习是什么?AIGC又是什么?机器学习与AIGC未来科技的双引擎
人工智能·python·机器学习
正义的彬彬侠4 小时前
《XGBoost算法的原理推导》12-14决策树复杂度的正则化项 公式解析
人工智能·决策树·机器学习·集成学习·boosting·xgboost
羊小猪~~4 小时前
神经网络基础--什么是正向传播??什么是方向传播??
人工智能·pytorch·python·深度学习·神经网络·算法·机器学习
正义的彬彬侠5 小时前
【scikit-learn 1.2版本后】sklearn.datasets中load_boston报错 使用 fetch_openml 函数来加载波士顿房价
python·机器学习·sklearn