数学建模—分类模型

本讲将介绍分类模型。对于而分类模型,我们将介绍逻辑回归(logistic regression)和Fisher线性判别分析两种分类算法;对于多分类模型,我们将简单介绍Spss中的多分类线性判别分析和多分类逻辑回归的操作步骤下。

本题按水果分类的例子

思路:逻辑回归原始现象

  1. 设置虚拟变量y
  2. 进行回归,估计出来的y-hat于虚拟变量中哪个更接近则分类为那个。

Eg:设1苹果,2橙子 若y与1接近为苹果,与0近为橙子

数据预处理生成虚拟变量

自变量mass重量,width水果宽度,height水果高度,color_score颜色(0-1)

因变量:fruit_name水果名

生成虚拟变量操作:转换->创建虚拟变量

3.逻辑回归:

4.建立模型:

不难看出u与x有相关性所以存在内生性,导致得到的数据不准确,所以需要进行改进。

解决内生性的方法:两点分布

连接函数的取法

这两个公式由图得出两个模型都符合x属于(-∞,+∞)y属于(0,1)

如何求解?

将自变量代入式子得到y与0.5对比(本题按0.5对比是水果案例)

极大似然估计能够估计粗B_hat再推出y_hat最后预测。

怎么用于分类?

这里我们选择第二个方程e^X/1+e^x

SPSS求解二元逻辑回归:

逻辑回归系数表:

假如自变量有分类变量怎么办?

预测结果较差怎么办?

负面影响:

增加平方自变量过于让拟合线完全贴近样本数据,导致预测数据不吻合。

如何确定合适的模型?(既使得样本数据符合,也使得预测数据更加可靠)

这里我们把苹果和橙子都剔除三个再对比

Fisher线性判断别分析

核心问题:找到系数向量w

SPSS操作:

多分类问题:

Fisher判断多分类

1.设置好分类数量

2.摘要表

3.保存中:预测组成员+组员概率

Fisher多分类判别结果结果:

Logistic多分类判别:

Spss操作:

分析->回归->多元Logistic

统计中:选择分类其余可看自己是否需要选择

保存中选择:估算响应概率,预测类。

结果:

课后作业:

解答:

为了方便能进行多元分类,我们需要自定义类别的名称,如将变色鸢尾为1,山鸢尾为2,维吉尼亚鸢尾为3.

博主选择了Logistic多元分类:

但是为了防止样本数据或预测数据的不准确性,我们将数据分为训练组和测试组,最后得到的分类结果。

预测结果:

相关推荐
leo__5201 小时前
单载波中继系统资源分配算法MATLAB仿真程序
算法·matlab·unity
南宫萧幕2 小时前
Python与Simulink联合仿真:基于DQN的HEV能量管理策略建模与全链路排雷实战
开发语言·人工智能·python·算法·机器学习·matlab·控制
isNotNullX5 小时前
数据分析怎么做?数据分析全流程是什么?
数据挖掘·数据分析
大龄程序员狗哥5 小时前
第49篇:TensorFlow Lite实战——将图像分类模型部署到安卓手机(项目实战)
android·分类·tensorflow
动物园猫5 小时前
工业粉尘检测数据集分享(适用于YOLO系列深度学习分类检测任务)
深度学习·yolo·分类
yongui478345 小时前
基于卷积神经网络(CNN)的盲源分离MATLAB实现
人工智能·matlab·cnn
listhi5205 小时前
基于SVM和决策树的孤岛检测MATLAB实现
决策树·支持向量机·matlab
Evand J5 小时前
【MATLAB例程】多传感器协同DOA目标跟踪与EKF滤波,输出动态目标轨迹、轨迹误差对比分析
开发语言·matlab·目标跟踪·滤波·定位·导航
数模竞赛Paid answer8 小时前
2025年MathorCup数学建模A题汽车风阻预测解题文档与程序
算法·数学建模·mathorcup
生信碱移14 小时前
PACells:这个方法可以鉴定疾病/预后相关的重要细胞亚群,作者提供的代码流程可以学习起来了,甚至兼容转录组与 ATAC 两种数据类型!
人工智能·学习·算法·机器学习·数据挖掘·数据分析·r语言