吴恩达机器学习下:二分类问题、逻辑回归、过拟合问题

26.动机_哔哩哔哩_bilibili

吴恩达机器学习笔记 - Sanzo Blog

一、二分类

1、 定义

什么是分类问题?------输出变量 y 只能取少数几个离散值,而不是无限范围内的任意数值。

问题只有两个可能的输出,这被称为二分类

  • 0 = 负类 / 否 / 假(例如:非垃圾邮件、良性肿瘤)。
  • 1 = 正类 / 是 / 真(例如:垃圾邮件、恶性肿瘤)。
  • "正类"与"负类"并不代表好坏,仅代表某种属性的存在或缺失。

2、为什么线性回归不适合分类?

如下图,你可能会想:"既然 y 是 0 或 1,我能不能直接用线性回归画一条直线,然后设定一个阈值(比如 0.5)来分类呢?"

  • 方法:如果预测值 <0.5 ,则预测为 0;如果 ≥0.5 ,则预测为 1。
  • 问题 :线性回归对异常值非常敏感,会导致分类边界发生不合理的偏移。
    • 假设在数据集的最右侧增加了一个非常大的训练样本(一个巨大的良性肿瘤)
    • 后果:线性回归为了拟合这个新点,会将直线"拉"向右边,导致斜率变平缓。
    • 决策边界移动:原本合理的决策边界(垂直线)被迫向右移动。
    • 错误:这导致原本应该被分类为"恶性"的肿瘤,现在被错误地分类为"良性"。

结论 :仅仅因为数据集中增加了一个远离主群体的样本,就改变了我们对其他数据的分类标准,这是不合理的。因此,线性回归不是解决分类问题的好算法

二、分类算法:逻辑回归【此次项目用不上】

虽然名字里有"回归",但它实际上是一种分类算法。这个名字是历史遗留原因,不要被误导。

核心优势

  • 逻辑回归的输出值永远在 0 到 1 之间
  • 它不会出现线性回归那样因为个别异常值而导致决策边界剧烈移动的问题。
  • 它是目前最流行、应用最广泛的分类算法之一。

具体的见下述链接"6、逻辑回归"

吴恩达机器学习笔记 - Sanzo Blog

三、过拟合问题

四、正则化解决过拟合问题

32.过拟合问题_哔哩哔哩_bilibili

相关推荐
小杨在厦门3 分钟前
从AI验布到智能质检:纺织企业智能化升级的三个台阶
人工智能·服装·服装厂·服装机械·铺布机
达之云*驭影3 分钟前
解锁流量密码:详解抖音AI智能推荐封面功能
人工智能
火山引擎开发者社区16 分钟前
ArkClaw 投研助理 —— 零门槛做投研,从一句话开始产出你的第一份深度研报
人工智能
码农小白AI19 分钟前
AI报告审核加速融入自动化实验室:IACheck破解智能设备时代报告管理新挑战
运维·人工智能·自动化
xingyuzhisuan25 分钟前
自建聚合网关VS第三方聚合平台,适配场景与数据实测
人工智能·ai·云计算·oneapi
tedcloud12327 分钟前
DeepSeek-TUI部署教程:打造CLI AI助手环境
服务器·人工智能·word·excel·dreamweaver
EnCi Zheng33 分钟前
09b-斯坦福CS336作业一-Transformer语言模型
人工智能
北辰alk34 分钟前
Agent 到底是什么?—— 从概念到实践的全面解析
人工智能
Promise微笑37 分钟前
2026年中国驱鸟器市场格局与主流品牌技术
大数据·人工智能
小白狮ww1 小时前
个人学习助手 DeepTutor:把论文检索、做题和学习规划一次打通
人工智能·知识库·多智能体·rag·ai学习工具·deeptutor·交互式学习