数学建模 15 逻辑回归与随机森林

逻辑回归(用于分类)

**用途:**通过已有数据,计算出线性方程的参数w后,可以用于预测某一个物品属于某一类的概率,[0,1];

求解思想: 逻辑回归通过最大似然估计(Maximum Likelihood Estimation, MLE) 学习参数w,核心思想是:找到一组w,使得 "所有训练样本的实际类别(y=1 或 y=0)与模型预测的概率(P (y=1|x))尽可能一致"。

情形适用:标签与属性有 极近线性关系,样本量需远大于特征量否则容易过拟合,特征间不能存在强相关性(如 "身高 cm" 和 "身高 m"),否则参数估计不稳定,必须进行数据的标准化/正向化/归一化;

随机森林(用于分类和回归预测)

**输出是:**特征重要性

适用范围: 数据之间存在非线性关联,可解释性强,可以输出重要特征。

**不适用范围:**数据维度极高且样本量少的场景(如 100 个样本、1000 个特征):易因 "特征随机选择" 导致信息利用率低。

得到主成分之后的选择:

相关推荐
蒋星熠17 小时前
Flutter跨平台工程实践与原理透视:从渲染引擎到高质产物
开发语言·python·算法·flutter·设计模式·性能优化·硬件工程
小欣加油17 小时前
leetcode 面试题01.02判定是否互为字符重排
数据结构·c++·算法·leetcode·职场和发展
3Cloudream17 小时前
LeetCode 003. 无重复字符的最长子串 - 滑动窗口与哈希表详解
算法·leetcode·字符串·双指针·滑动窗口·哈希表·中等
王璐WL17 小时前
【c++】c++第一课:命名空间
数据结构·c++·算法
空白到白18 小时前
机器学习-聚类
人工智能·算法·机器学习·聚类
索迪迈科技18 小时前
java后端工程师进修ing(研一版 || day40)
java·开发语言·学习·算法
zzzsde18 小时前
【数据结构】队列
数据结构·算法
芒克芒克19 小时前
LeetCode 面试经典 150 题:删除有序数组中的重复项(双指针思想解法详解)
算法
青 .19 小时前
数据结构---二叉搜索树的实现
c语言·网络·数据结构·算法·链表
MChine慕青19 小时前
顺序表与单链表:核心原理与实战应用
linux·c语言·开发语言·数据结构·c++·算法·链表