【漫话机器学习系列】194.“一对其余”逻辑回归(One-Vs-Rest Logistic Regression)


一对其余(One-Vs-Rest)逻辑回归 ------ 多分类问题中的经典思路

原图作者:Chris Albon

适用场景:机器学习 / 数据挖掘 / 多分类建模


一、背景介绍

1.1 什么是逻辑回归?

逻辑回归(Logistic Regression)是机器学习中一种非常经典的二分类算法。它的核心思想是:

  • 输入特征(X)
  • 输出一个概率(0 到 1 之间)
  • 用阈值(通常是0.5)决定分类结果

适用于解决「是 / 否」这类二分类问题。


1.2 但实际问题往往不止两个类别

现实世界的数据,经常是多类别(Multi-class)的,比如:

场景 类别
邮件分类 正常 / 垃圾 / 广告 / 诈骗
图像识别 狗 / 猫 / 鸟 / 其他
客户状态 活跃 / 流失 / 潜在

那么,逻辑回归能不能处理这种多分类问题呢?

答案是:可以,但需要扩展。 其中一种常用的扩展方式就是 ------ 一对其余(One-Vs-Rest,简称 OvR 或 OVR)


二、什么是一对其余(One-Vs-Rest)逻辑回归?

一对其余(One-Vs-Rest Logistic Regression):是二元逻辑回归的扩展版,用于解决多分类问题。

核心思想非常直观:

  • 针对每个类别,单独构建一个二分类器。

  • 让模型学会区分:

    • 这个类别(1)
    • 其他所有类别(0)

三、工作机制与流程

假设现在有 3 个类别:

  • 类别A
  • 类别B
  • 类别C

步骤如下:

类别 模型构建方式 训练目标
A vs Rest A 为正类(1),其他为负类(0) 判断是否属于A
B vs Rest B 为正类(1),其他为负类(0) 判断是否属于B
C vs Rest C 为正类(1),其他为负类(0) 判断是否属于C

也就是说,原本是一个多分类问题,现在被拆解为 3 个独立的二分类问题。


四、预测流程

  1. 输入一个样本
  2. 让这 3 个模型分别打分(预测为各自类别的概率)
  3. 选择概率最大的类别,作为最终预测结果

这种思路的好处在于:

  • 简单直接
  • 每个模型专注判断"自己 vs 其他"
  • 可以复用原有的二分类工具(逻辑回归、支持向量机、朴素贝叶斯等)

五、总结

优点 缺点
简单易实现,容易理解 类别不均衡时效果不佳
模型独立训练,便于并行 类别数太多时,模型数量膨胀
兼容所有二分类器 类别之间没有直接关系建模

六、适用场景

One-Vs-Rest 通常适合:

  • 类别数量不多
  • 各类别之间独立、差异较大
  • 希望复用现有二分类模型

七、在 Python 中如何实现 OvR 逻辑回归?

sklearn 已经帮我们封装好了:

ini 复制代码
from sklearn.linear_model import LogisticRegression

# OvR 是 sklearn 中多分类的默认方式
model = LogisticRegression(multi_class='ovr')
model.fit(X_train, y_train)

八、与其他多分类方法对比

方法 说明
One-Vs-Rest 一对其余,每个类别单独建模
One-Vs-One 一对一,每两个类别都建一个模型
Softmax Regression 直接学习多类别之间的概率分布(常用于深度学习)

九、一句话总结

One-Vs-Rest 逻辑回归 = 把多分类问题转化为多个二分类问题,简单、直观,适用于小类别场景,是机器学习入门多分类的首选思路之一。

相关推荐
星期天要睡觉11 分钟前
深度学习——数据增强(Data Augmentation)
人工智能·深度学习
南山二毛1 小时前
机器人控制器开发(导航算法——导航栈关联坐标系)
人工智能·架构·机器人
大数据张老师2 小时前
【案例】AI语音识别系统的标注分区策略
人工智能·系统架构·语音识别·架构设计·后端架构
xz2024102****2 小时前
吴恩达机器学习合集
人工智能·机器学习
anneCoder2 小时前
AI大模型应用研发工程师面试知识准备目录
人工智能·深度学习·机器学习
骑驴看星星a2 小时前
没有深度学习
人工智能·深度学习
youcans_2 小时前
【医学影像 AI】YoloCurvSeg:仅需标注一个带噪骨架即可实现血管状曲线结构分割
人工智能·yolo·计算机视觉·分割·医学影像
空白到白2 小时前
机器学习-决策树
人工智能·决策树·机器学习
奇舞精选2 小时前
超越Siri的耳朵:ASR与Whisper零代码部署实战指南
前端·人工智能·aigc
说私域2 小时前
兴趣电商内容数据洞察未来市场走向研究——基于开源AI智能名片链动2+1模式S2B2C商城小程序的实践
人工智能·小程序