吴恩达2022机器学习专项课程(一) 6.1 动机&第三周课后实验:Lab1使用逻辑回归进行分类

问题预览/关键词

  1. 回归和分类的区别?
  2. 逻辑回归的作用是?
  3. 什么是二分类问题?
  4. 二分类问题案例
  5. 如何表达二分类的结果?逻辑回归通常用哪种表达形式?
  6. 什么是正样本和负样本?
  7. 什么是阈值?
  8. 可视化线性回归解决二分类
  9. 线性回归面对二分类产生的问题
  10. 存储分类数据集
  11. 分类数据集的散点图
  12. 线性回归演示分类

笔记

1.回归和分类的区别

回归是从无限的值预测一个任意数字,而分类是从少量的值中确定一个数字。

2.逻辑回归的作用

逻辑回归用于解决二分类问题。

3.二分类问题

结果只有两种可能(分类),将预测的结果分为两种结果的一种。

4.二分类问题案例

邮件是否为垃圾?金融交易是否为欺诈?肿瘤是恶性还是良性?

5.二分类问题的结果表达

是或否,假或真,0或1,逻辑回归通常选择0或1表示预测结果y。

6.正样本和负样本

也是一结果种表达方式,更加术语化。在判定是否为垃圾邮件时,正常邮件为负样本,垃圾邮件为正样本。正负是相对于判定的事件而言,不代表好坏。

7.阈值:

一个数值,通常选择0.5,该数值用于判断分类问题的预测结果属于0还是属于1。

8.线性回归解决二分类问题

预测值小于0.5,预测即为良性,预测值大于等于0.5,预测即为恶性。

9.线性回归面对二分类的问题

如果新增一个训练样本,首先改变了分类方式(重新画条绿线),其次改变了我们之前预测的结论(阈值为0.5,小于0.5为良性,而此时两个小于0.5的数据点是恶性的)。

10.分类问题数据集的存储

y通常是0或1。

11.数据集散点图

  • 只有一个特征和y的分布,注意y的范围在0-1,如果是线性回归问题,y的范围不止0-1。
  • 两个特征与y之间的分布。-

12.线性回归演示分类

  • 使用线性回归对x_train和y_train分类,阈值选择0.5,模型可以很好的区分恶性和良性,此时y=0.24x+(-0.10)。
  • 如果增加数据,则线性回归模型的预测就会出错。

总结

面对二分类问题,如果使用线性回归解决,在阈值选对的情况下,可能有效果。但如果二分类的数据集较为复杂,则线性回归的预测就会出现偏差,此时应该使用逻辑回归解决二分类。我们不会直接靠预测结果分类,而是设置一个阈值,然后将预测结果和阈值比较,进而将预测结果分类。本节课程演示的全是一个特征的分类,吴恩达教授只是想通过简单的例子,让大家看到线性回归用于解决分类问题的局限性。

相关推荐
HyperAI超神经44 分钟前
Meta 首个多模态大模型一键启动!首个多针刺绣数据集上线,含超 30k 张图片
大数据·人工智能·深度学习·机器学习·语言模型·大模型·数据集
sp_fyf_20241 小时前
计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-03
人工智能·算法·机器学习·计算机视觉·语言模型·自然语言处理
学步_技术1 小时前
自动驾驶系列—线控悬架技术:自动驾驶背后的动力学掌控者
人工智能·机器学习·自动驾驶·线控系统·悬挂系统
牛哥带你学代码2 小时前
交叠型双重差分法
人工智能·深度学习·机器学习
学步_技术2 小时前
自动驾驶系列—线控系统:驱动自动驾驶的核心技术解读与应用指南
人工智能·机器学习·自动驾驶·线控系统·转向系统
quaer3 小时前
Open-Sora全面开源?
开发语言·算法·机器学习·matlab·矩阵
墨@#≯3 小时前
机器学习系列篇章0 --- 人工智能&机器学习相关概念梳理
人工智能·经验分享·机器学习
_.Switch3 小时前
Python机器学习模型的部署与维护:版本管理、监控与更新策略
开发语言·人工智能·python·算法·机器学习
model20054 小时前
android + tflite 分类APP开发-2
android·分类·tflite
技术无疆5 小时前
【Python】Streamlit:为数据科学与机器学习打造的简易应用框架
开发语言·人工智能·python·深度学习·神经网络·机器学习·数据挖掘