【Python机器学习】线性模型——用于多分类的线性模型

很多线性分类模型只使用与二分类问题,将二分类算法推广到多分类算法的一种常见方法是"一对其余"方法。在"一对其余"方法中,对每个类别都学习一个二分类模型,将这个类别和其他类别尽量区分,这样就生成了与类别数相同的二分类模型数。在测试点上运行所有分类器进行预测,在对应类别上分数最高的分类器"胜出",将这个类别标签范围作为预测结果。

多分类Logistics回归背后的数学与"一对其余"方法稍有不同,但也是对每个类别都有一个系数向量和一个截距,也使用了同样的预测方法。

以一个三分类的二维数据集为例:

python 复制代码
from sklearn.datasets import make_blobs
import matplotlib.pyplot as plt
import mglearn
from sklearn.svm import LinearSVC
import numpy as np


plt.rcParams['font.sans-serif']=['SimHei']
X,y=make_blobs(random_state=42)
mglearn.discrete_scatter(X[:,0],X[:,1],y)
plt.ylim(-10,15)
plt.xlim(-10,10)
plt.xlabel('0')
plt.ylabel('1')
plt.legend(['类别0','类别1','类别2'],loc=(1.01,0.3))

plt.show()

在这个数据集上训练LinearSVC分类器:

python 复制代码
line_svc=LinearSVC().fit(X,y)
print('coef_形状:{}'.format(line_svc.coef_.shape))
print('intercept_形状:{}'.format(line_svc.intercept_.shape))

可以看到coef_的形状是(3,2),说明coef_每行包括三个分类之一的系数向量,每列包含某个特征对应的系数值。

对3个二类分类器给出可视化:

训练集中所有属于类别0的点都在与类别0对应的直线上方,说明他们位于这个二类分类器属于类别0的那一侧。没有直接和某类点在同一个区域的点,属于"其余"部分。"其余"部分,属于分类方程结果最大的那个类别,即最近的的那条线对应的类别:

相关推荐
生成论实验室2 分钟前
给机器人和自动驾驶装上判断力,会怎样?
人工智能·深度学习·机器学习·机器人·自动驾驶
码界筑梦坊2 分钟前
153-基于FLask的英国希思罗机场天气数据可视化分析系统
python·信息可视化·数据分析·flask
weixin_468466857 分钟前
目标识别算法落地实战:从选型到部署的全流程指南
图像处理·人工智能·python·算法·目标检测·机器视觉·目标识别
NiceCloud喜云15 分钟前
Anthropic 发布 Project Glasswing:未公开模型 Mythos 已挖出 10000+ 漏洞,含 OpenBSD 27 年老 bug
android·java·数据库·c++·python·docker·bug
AI医影跨模态组学18 分钟前
Nat Commun(IF=15.7)波士顿大学医学院:基于人工智能的多模态数据融合用于阿尔茨海默病生物标志物评估
人工智能·深度学习·机器学习·论文·医学影像
asdzx6719 分钟前
Python TXT 转 Excel (自动识别分隔符)
python·excel
风虎云龙科研服务器20 分钟前
告别几何缩微,拥抱时间优化:韬(τ)定律开启后摩尔时代新周期
大数据·人工智能·深度学习·机器学习·tensorflow
Yan-英杰21 分钟前
亮数据 - Ticket_Hunter_Agent
人工智能·神经网络·机器学习·ai开发工具
星越华夏22 分钟前
Polars中导入excel文件
python·pandas
weixin_4684668539 分钟前
大语言模型智能助手核心应用场景与落地指南
人工智能·python·深度学习·神经网络·语言模型·自然语言处理·大语言模型