【Python机器学习】线性模型——用于多分类的线性模型

很多线性分类模型只使用与二分类问题,将二分类算法推广到多分类算法的一种常见方法是"一对其余"方法。在"一对其余"方法中,对每个类别都学习一个二分类模型,将这个类别和其他类别尽量区分,这样就生成了与类别数相同的二分类模型数。在测试点上运行所有分类器进行预测,在对应类别上分数最高的分类器"胜出",将这个类别标签范围作为预测结果。

多分类Logistics回归背后的数学与"一对其余"方法稍有不同,但也是对每个类别都有一个系数向量和一个截距,也使用了同样的预测方法。

以一个三分类的二维数据集为例:

python 复制代码
from sklearn.datasets import make_blobs
import matplotlib.pyplot as plt
import mglearn
from sklearn.svm import LinearSVC
import numpy as np


plt.rcParams['font.sans-serif']=['SimHei']
X,y=make_blobs(random_state=42)
mglearn.discrete_scatter(X[:,0],X[:,1],y)
plt.ylim(-10,15)
plt.xlim(-10,10)
plt.xlabel('0')
plt.ylabel('1')
plt.legend(['类别0','类别1','类别2'],loc=(1.01,0.3))

plt.show()

在这个数据集上训练LinearSVC分类器:

python 复制代码
line_svc=LinearSVC().fit(X,y)
print('coef_形状:{}'.format(line_svc.coef_.shape))
print('intercept_形状:{}'.format(line_svc.intercept_.shape))

可以看到coef_的形状是(3,2),说明coef_每行包括三个分类之一的系数向量,每列包含某个特征对应的系数值。

对3个二类分类器给出可视化:

训练集中所有属于类别0的点都在与类别0对应的直线上方,说明他们位于这个二类分类器属于类别0的那一侧。没有直接和某类点在同一个区域的点,属于"其余"部分。"其余"部分,属于分类方程结果最大的那个类别,即最近的的那条线对应的类别:

相关推荐
够快云库14 小时前
能源行业非结构化数据治理实战:从数据沼泽到智能资产
大数据·人工智能·机器学习·企业文件安全
多恩Stone14 小时前
【C++入门扫盲1】C++ 与 Python:类型、编译器/解释器与 CPU 的关系
开发语言·c++·人工智能·python·算法·3d·aigc
QQ40220549615 小时前
Python+django+vue3预制菜半成品配菜平台
开发语言·python·django
百锦再15 小时前
Django实现接口token检测的实现方案
数据库·python·django·sqlite·flask·fastapi·pip
QQ51100828515 小时前
python+springboot+django/flask的校园资料分享系统
spring boot·python·django·flask·node.js·php
QQ_196328847515 小时前
Python-flask框架西山区家政服务评价系统网站设计与开发-Pycharm django
python·pycharm·flask
遥遥江上月15 小时前
Node.js + Stagehand + Python 部署
开发语言·python·node.js
B站计算机毕业设计超人15 小时前
计算机毕业设计Django+Vue.js音乐推荐系统 音乐可视化 大数据毕业设计 (源码+文档+PPT+讲解)
大数据·vue.js·hadoop·python·spark·django·课程设计
B站_计算机毕业设计之家15 小时前
电影知识图谱推荐问答系统 | Python Django系统 Neo4j MySQL Echarts 协同过滤 大数据 人工智能 毕业设计源码(建议收藏)✅
人工智能·python·机器学习·django·毕业设计·echarts·知识图谱
计算机专业码农一枚15 小时前
Python-flask框架基于推荐算法的在线课程推荐系统设计与实现-Pycharm django
python·flask·推荐算法