吴恩达《机器学习》6-1->6-3:分类问题、假设陈述、决策界限

一、什么是分类问题?

在分类问题中,我们试图预测的变量𝑦是离散的值,通常表示某种类别或标签。这些类别可以是二元的,也可以是多元的。分类问题的示例包括:

  • 判断一封电子邮件是否是垃圾邮件(二元分类)
  • 判断一次金融交易是否涉及欺诈(二元分类)
  • 区分肿瘤是恶性的还是良性的(二元分类)
  • 图像识别:将图像分为不同的类别(多元分类)

分类问题在现实世界中无处不在,因此开发有效的分类算法至关重要。逻辑回归是其中一种应用最广泛的分类算法。

二、逻辑回归

逻辑回归是一种分类算法,尽管其名称中包含"回归",但它实际上是用于分类任务的算法。逻辑回归的特点是其输出值永远在0到1之间,这使得它非常适合处理离散的标签,如0和1。

与线性回归不同,逻辑回归的输出范围被约束在0, 1之间,因此它适用于计算概率。具体来说,逻辑回归模型使用一个逻辑函数(Sigmoid函数)来将输入映射到0和1之间。逻辑函数的公式为:

css 复制代码
g(z) = 1 / (1 + e^(-z))

在这个公式中,z表示输入,g(z)表示逻辑函数。逻辑函数的作用是计算在给定输入条件下,输出为1的可能性。如果g(z)大于等于0.5,则模型预测为1;如果g(z)小于0.5,则模型预测为0。

三、假设函数表示

逻辑回归模型的假设函数表示如下:

python 复制代码
ℎ𝜃(𝑥) = 𝑔(𝜃^𝑇𝑥)

在这个表示中,𝑥代表特征向量,𝑔代表逻辑函数。模型的任务是根据选择的参数计算输出变量为1的可能性,即ℎ𝜃(𝑥) = 𝑃(𝑦 = 1|𝑥; 𝜃)。例如,如果计算得到ℎ𝜃(𝑥) = 0.7,那么表示有70%的几率𝑦为正向类,相应地𝑦为负向类的几率为0.3。

四、判定边界

在逻辑回归中,我们通过选择适当的参数𝜃来定义一个决策边界(decision boundary),该边界将数据分为不同的类别。决策边界是一个分割区域,对于不同的输入数据,模型会预测其属于不同的类别。

逻辑回归的假设函数可以表示为:

python 复制代码
ℎ𝜃(𝑥) = 𝑔(𝜃0 + 𝜃1𝑥1 + 𝜃2𝑥2 + 𝜃3𝑥1² + 𝜃4𝑥2²)

在上述表达式中,𝑥1和𝑥2是特征,𝜃0、𝜃1、𝜃2、𝜃3、𝜃4是模型的参数。根据不同的参数,我们可以得到不同的决策边界。这意味着逻辑回归模型可以适应各种形状的决策边界,从简单的直线到复杂的曲线。

参考资料

中英字幕吴恩达机器学习系列课程

黄海广博士 - 吴恩达机器学习个人笔记

相关推荐
TE-茶叶蛋21 分钟前
学习GitNexus中优雅的自动滚动:useAutoScroll Hook 实现
学习
whyTeaFo33 分钟前
MIT 6.1810: Lab traps: traps
笔记
云和数据.ChenGuang35 分钟前
openEuler下NLP模型的部署和推理
人工智能·深度学习·机器学习·自然语言处理·数据挖掘·边缘计算
小陈phd41 分钟前
多模态大模型学习笔记(四十八)——从自然语言到 SQL:大模型时代结构化数据查询的技术革命与落地实践
笔记·sql·学习
星夜夏空991 小时前
FreeRTOS学习(12)——任务通知
学习·性能优化
AOwhisky1 小时前
学习自测(MySQL系列第一期、第二期)
linux·运维·数据库·学习·mysql·云计算
人工智能培训1 小时前
数字孪生建模常用方式有哪些?
人工智能·深度学习·机器学习·容器·知识图谱
元气少女小圆丶1 小时前
SenseGlove Nova 2+Unity开发笔记4
笔记·unity·游戏引擎
轻刀快马2 小时前
跨越“拟人”的最后一道天堑:大模型强化学习(RLHF/RLAIF)底层原理解析
人工智能·深度学习·机器学习
ZK_H2 小时前
MFC程序开发自学笔记其一——windows应用程序与c++基础
c++·笔记·mfc