吴恩达2022机器学习专项课程(一) 6.1 动机&第三周课后实验:Lab1使用逻辑回归进行分类

问题预览/关键词

  1. 回归和分类的区别?
  2. 逻辑回归的作用是?
  3. 什么是二分类问题?
  4. 二分类问题案例
  5. 如何表达二分类的结果?逻辑回归通常用哪种表达形式?
  6. 什么是正样本和负样本?
  7. 什么是阈值?
  8. 可视化线性回归解决二分类
  9. 线性回归面对二分类产生的问题
  10. 存储分类数据集
  11. 分类数据集的散点图
  12. 线性回归演示分类

笔记

1.回归和分类的区别

回归是从无限的值预测一个任意数字,而分类是从少量的值中确定一个数字。

2.逻辑回归的作用

逻辑回归用于解决二分类问题。

3.二分类问题

结果只有两种可能(分类),将预测的结果分为两种结果的一种。

4.二分类问题案例

邮件是否为垃圾?金融交易是否为欺诈?肿瘤是恶性还是良性?

5.二分类问题的结果表达

是或否,假或真,0或1,逻辑回归通常选择0或1表示预测结果y。

6.正样本和负样本

也是一结果种表达方式,更加术语化。在判定是否为垃圾邮件时,正常邮件为负样本,垃圾邮件为正样本。正负是相对于判定的事件而言,不代表好坏。

7.阈值:

一个数值,通常选择0.5,该数值用于判断分类问题的预测结果属于0还是属于1。

8.线性回归解决二分类问题

预测值小于0.5,预测即为良性,预测值大于等于0.5,预测即为恶性。

9.线性回归面对二分类的问题

如果新增一个训练样本,首先改变了分类方式(重新画条绿线),其次改变了我们之前预测的结论(阈值为0.5,小于0.5为良性,而此时两个小于0.5的数据点是恶性的)。

10.分类问题数据集的存储

y通常是0或1。

11.数据集散点图

  • 只有一个特征和y的分布,注意y的范围在0-1,如果是线性回归问题,y的范围不止0-1。
  • 两个特征与y之间的分布。-

12.线性回归演示分类

  • 使用线性回归对x_train和y_train分类,阈值选择0.5,模型可以很好的区分恶性和良性,此时y=0.24x+(-0.10)。
  • 如果增加数据,则线性回归模型的预测就会出错。

总结

面对二分类问题,如果使用线性回归解决,在阈值选对的情况下,可能有效果。但如果二分类的数据集较为复杂,则线性回归的预测就会出现偏差,此时应该使用逻辑回归解决二分类。我们不会直接靠预测结果分类,而是设置一个阈值,然后将预测结果和阈值比较,进而将预测结果分类。本节课程演示的全是一个特征的分类,吴恩达教授只是想通过简单的例子,让大家看到线性回归用于解决分类问题的局限性。

相关推荐
石迹耿千秋5 小时前
迁移学习--基于torchvision中VGG16模型的实战
人工智能·pytorch·机器学习·迁移学习
Wendy14417 小时前
【线性回归(最小二乘法MSE)】——机器学习
算法·机器学习·线性回归
wh_xia_jun12 小时前
基础分类模型及回归简介(一)
分类·数据挖掘·回归
lishaoan7713 小时前
用TensorFlow进行逻辑回归(四)
人工智能·tensorflow·逻辑回归
霖0016 小时前
神经网络项目--基于FPGA的AI简易项目(1-9图片数字识别)
人工智能·pytorch·深度学习·神经网络·机器学习·fpga开发
神经星星16 小时前
英伟达实现原子级蛋白质设计突破,高精度生成多达800个残基的蛋白质
人工智能·深度学习·机器学习
居然JuRan18 小时前
一文看懂 MOE 模型:让大模型像医院看病一样高效工作
人工智能·机器学习
钮钴禄·爱因斯晨1 天前
机器学习:数据清洗与预处理 | Python
人工智能·python·机器学习
wh_xia_jun1 天前
心电图时间序列的 ARMA 模型分析与预测
机器学习
wh_xia_jun1 天前
医疗数据分析中标准化的作用
人工智能·机器学习