数学建模【分类模型】

一、分类模型简介

本篇将介绍分类模型。对于二分类模型,我们将介绍逻辑回归(logistic regression)和Fisher线性判别分析两种分类算法;对于多分类模型,我们将简单介绍SPSS中的多分类线性判别分析和多分类逻辑回归。

分类模型,顾名思义将数据分类。如有一堆苹果和橙子,有它们的重量,大小,颜色等数据,将它们根据数据分为两类,之后如果给出数据,可以进行一定的判断,这个只有数据的是苹果还是橙子。

二、适用赛题

预测类

  • 由已知数据处理分类得到模型
  • 对后来的数据进行预测

三、模型流程

四、流程分析

本篇中的逻辑回归和Fisher线性判别不做证明,且逻辑回归和Fisher线性判别推荐使用SPSS软件进行操作

1.确定分类

分类模型有二分类和多分类两种,开始先得确定要分多少类。比如上面的苹果和橙子例子就是二分类;如果水果种类再多点,像苹果、橙子、柠檬和橘子,就是多分类问题。

2.二分类
①逻辑回归

对于因变量为分类变量的情况,我们可以使用逻辑回归进行处理。把y看成事件发生的概率,y ≥ 0.5表示发生;y < 0.5表示不发生。比如可以说y ≥ 0.5是苹果,y < 0.5是橙子。

线性概率模型(Linear Probability Model 简记LPM)

由于后者有解析表达式(而标准正态分布的cdf没有),所以计算logistic模型比probit模型更为方便。

②Fisher线性判别分析

LDA(Linear Discriminant Analysis)是一种经典的线性判别方法,又称Fisher判别分析。该方法思想比较简单:给定训练集样例,设法将样例投影到一维的直线上,使得同类样例的投影点尽可能接近和密集,异类投影点尽可能远离。

可借助SPSS软件直接得到结果。

3.多分类

多分类的操作和二分类类似,这里不再赘述。

4.合理性
如果预测结果较差怎么办?

可在Logistic回归模型中加入平方项、交互项等。

但在加入平方项之后,虽然预测能力提高了,但有可能会出现过拟合现象。

也就是对于样本数据的预测非常好,但是对于样本外的数据的预测效果可能会很差。

所以如何确定合适的模型?

把数据分为训练组和测试组,用训练组的数据来估计出模型,再用测试组的数据来进行测试。(训练组和测试组的比例一般设置为80%和20%)

注意:为了消除偶然性的影响,可以对上述步骤多重复几次,最终对每个模型求--个平均的准确率,这个步骤称为交叉验证。

5.预测

根据给出的数据,计算得到属于哪个类别的可能性最大。

相关推荐
IT猿手2 小时前
2025最新群智能优化算法:云漂移优化(Cloud Drift Optimization,CDO)算法求解23个经典函数测试集,MATLAB
开发语言·数据库·算法·数学建模·matlab·机器人
何仙鸟3 小时前
深度学习分类回归(衣帽数据集)
深度学习·分类·回归
max5006004 小时前
用python 的 sentiment intensity analyzer的情感分析器,将用户评论进行分类
人工智能·python·分类
IT猿手9 小时前
2025最新群智能优化算法:山羊优化算法(Goat Optimization Algorithm, GOA)求解23个经典函数测试集,MATLAB
人工智能·python·算法·数学建模·matlab·智能优化算法
AAA顶置摸鱼14 小时前
机器学习·NLP中的文本分类
机器学习·自然语言处理·分类
项目申报小狂人15 小时前
高性能算法NGO!北方苍鹰优化算法(Northern Goshawk Optimization,NGO)
算法·数学建模
人大博士的交易之路1 天前
本周行情——20250308
人工智能·数学建模·分类·数据挖掘·量化交易·缠论·缠中说禅
xidianjiapei0011 天前
一文读懂深度学习中的损失函数quantifying loss —— 作用、分类和示例代码
人工智能·深度学习·分类·损失函数·交叉熵
紫雾凌寒1 天前
AI Agent 分类详解:从反射 Agent 到学习型 Agent 的演进
人工智能·机器学习·分类·agent·智能体·manus
Tom Boom1 天前
1.11.信息系统的分类【DSS】
人工智能·算法·机器学习·职场和发展·分类·数据挖掘·系统架构