吴恩达2022机器学习专项课程(一) 6.1 动机&第三周课后实验:Lab1使用逻辑回归进行分类

问题预览/关键词

  1. 回归和分类的区别?
  2. 逻辑回归的作用是?
  3. 什么是二分类问题?
  4. 二分类问题案例
  5. 如何表达二分类的结果?逻辑回归通常用哪种表达形式?
  6. 什么是正样本和负样本?
  7. 什么是阈值?
  8. 可视化线性回归解决二分类
  9. 线性回归面对二分类产生的问题
  10. 存储分类数据集
  11. 分类数据集的散点图
  12. 线性回归演示分类

笔记

1.回归和分类的区别

回归是从无限的值预测一个任意数字,而分类是从少量的值中确定一个数字。

2.逻辑回归的作用

逻辑回归用于解决二分类问题。

3.二分类问题

结果只有两种可能(分类),将预测的结果分为两种结果的一种。

4.二分类问题案例

邮件是否为垃圾?金融交易是否为欺诈?肿瘤是恶性还是良性?

5.二分类问题的结果表达

是或否,假或真,0或1,逻辑回归通常选择0或1表示预测结果y。

6.正样本和负样本

也是一结果种表达方式,更加术语化。在判定是否为垃圾邮件时,正常邮件为负样本,垃圾邮件为正样本。正负是相对于判定的事件而言,不代表好坏。

7.阈值:

一个数值,通常选择0.5,该数值用于判断分类问题的预测结果属于0还是属于1。

8.线性回归解决二分类问题

预测值小于0.5,预测即为良性,预测值大于等于0.5,预测即为恶性。

9.线性回归面对二分类的问题

如果新增一个训练样本,首先改变了分类方式(重新画条绿线),其次改变了我们之前预测的结论(阈值为0.5,小于0.5为良性,而此时两个小于0.5的数据点是恶性的)。

10.分类问题数据集的存储

y通常是0或1。

11.数据集散点图

  • 只有一个特征和y的分布,注意y的范围在0-1,如果是线性回归问题,y的范围不止0-1。
  • 两个特征与y之间的分布。-

12.线性回归演示分类

  • 使用线性回归对x_train和y_train分类,阈值选择0.5,模型可以很好的区分恶性和良性,此时y=0.24x+(-0.10)。
  • 如果增加数据,则线性回归模型的预测就会出错。

总结

面对二分类问题,如果使用线性回归解决,在阈值选对的情况下,可能有效果。但如果二分类的数据集较为复杂,则线性回归的预测就会出现偏差,此时应该使用逻辑回归解决二分类。我们不会直接靠预测结果分类,而是设置一个阈值,然后将预测结果和阈值比较,进而将预测结果分类。本节课程演示的全是一个特征的分类,吴恩达教授只是想通过简单的例子,让大家看到线性回归用于解决分类问题的局限性。

相关推荐
OpenBayes贝式计算3 天前
解决视频模型痛点,TurboDiffusion 高效视频扩散生成系统;Google Streetview 涵盖多个国家的街景图像数据集
人工智能·深度学习·机器学习
OpenBayes贝式计算4 天前
OCR教程汇总丨DeepSeek/百度飞桨/华中科大等开源创新技术,实现OCR高精度、本地化部署
人工智能·深度学习·机器学习
够快云库4 天前
能源行业非结构化数据治理实战:从数据沼泽到智能资产
大数据·人工智能·机器学习·企业文件安全
B站_计算机毕业设计之家4 天前
电影知识图谱推荐问答系统 | Python Django系统 Neo4j MySQL Echarts 协同过滤 大数据 人工智能 毕业设计源码(建议收藏)✅
人工智能·python·机器学习·django·毕业设计·echarts·知识图谱
Flying pigs~~4 天前
机器学习之逻辑回归
人工智能·机器学习·数据挖掘·数据分析·逻辑回归
Evand J4 天前
通过matlab实现机器学习的小项目示例(鸢尾花分类)
机器学习·支持向量机·matlab
_Li.5 天前
Simulink - 6DOF (Euler Angles)
人工智能·算法·机器学习·游戏引擎·cocos2d
Project_Observer5 天前
工时日志在项目进度管理中扮演着怎样的角色?
数据库·深度学习·机器学习
scott1985125 天前
Improving Classifier-Free Guidance of Flow Matching via Manifold Projection
人工智能·python·机器学习