数学建模-多元线性回归笔记

数学建模笔记

1.学模型✅

2.看专题论文并复习算法

  • 多元线性回归

    • 无偏性:预测值与真实值非常接近
    • 一致性:样本量无限增大,收敛于待估计参数的真值
    • 如何做:控制核心解释变量和u不相关
  • 四类模型回归系数的解释

    • 截距项不用考虑
    • 一元线性回归:y = a + bx + u
      • x每增加1个单位,y平均变化b个单位
    • 双对数模型:lny = a + blnx + u
      • x每增加1%,y平均变化b%
    • 半对数模型:y = a + blnx
      • x每增加1%,y平均变化b/100个单位
    • 半对数模型:lny = a + bx
      • x每增加1个单位,y平均变化(100b)%
  • 算回归系数要避免多重共线性

  • 客户对产品的关注度可以利用爬虫爬取评价量来表示

  • 多元线性回归 软件:STATA

    • 导入数据
    • 描述性统计:
      • 定量数据:summarize 评价量
        • 右键,复制表格
      • 定性数据:tabulate 变量名,<gen(A)>
        • 数据编辑器
    • 打开do文件,运行一部分
    • 回归数据说明
      • 外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-weXrLv8R-1692215418652)(media/16921742285760/16921799343967.jpg)

  • STATA回归

    • regress y x1 x2 ... xk(默认用OLS:普通最小二乘法)
    • 加入虚拟变量(定类变量)
      • regress y x1 G1 G2 G3 G4
  • 结果分析

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-JvvgaXYh-1692215418654)(media/16921742285760/16921809215912.jpg)

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-1r8mMi44-1692215418654)(media/16921742285760/16921818296992.jpg)

P值小于0.05, 说明模型在95%的水平下拒绝原假设,通过了联合显著性检验,说明模型是合理的。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-OraqDFUn-1692215418655)(media/16921742285760/16921809359312.jpg)

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0iMtwXmo-1692215418656)(media/16921742285760/16921818370769.jpg)

先看哪些值是显著的,选择置信水平,然后选择变量,开始分析。

选择置信水平为90%,这里有两个变量是显著的,团购价在其他变量不变的情况下,每增加一元,评价量减小-29.77。控制其他变量不变的情况下,分类为羊奶粉的变量比分类为牛奶粉的评价量高14894.

  • 把回归结果保存到word中

    • est store m1
    • reg2docx m1 using m1.docx, replace
    • // *** p<0.01 ** p<0.05 * p<0.1

      外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tyVdON0T-1692215418656)(media/16921742285760/16921824817070.jpg)

    • 加上右下角的标记
  • excel数据透视图会了,数据处理能超过大部分人

  • 回归分为解释型回归和预测型回归。

    • 预测型回归一般才会更看重R^2。
    • 解释型回归更多的关注模型整体显著性以及自变量的统计显著性和经济意义显著性即可。
  • 为了更为精准的研究影响评价量的重要因素(去除量纲的影响),我们可考虑使用标准化回归系数。

  • 对数据进行标准化,就是将原始数据减去它的均数后,再除以该变量的标准差,计算得到新的变量值,新变量构成的回归方程称为标准化回归方程,回归后相应可得到标准化回归系数。

  • 标准化系数的绝对值越大,说明对因变量的影响就越大(只关注显著的回归系数哦)

  • 回归标准化后得到的系数得到影响程度,不标准化得到的系数才能拿来预测。

  • 标准化回归的命令

    • regress y x1 x2 ... xk, beta
    • 系数是最后一列

      外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-S1WGFZYK-1692215418656)(media/16921742285760/16921833650579.jpg)

  • 结果阅读:在显著的前提下,绝对值要大

  • 归一化后算得的系数会不好解释

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-gQBRMqSe-1692215443131)(https://cdn.jsdelivr.net/gh/jixiuy/clouding/image-20230817034835596.png)

这篇文章还没有配置图层利用 PicGo+Typora+Github

相关推荐
平和男人杨争争44 分钟前
机器学习14——线性回归
人工智能·机器学习·线性回归
潇-xiao4 小时前
进程状态 + 进程优先级切换调度-进程概念(5)
linux·笔记
骁的小小站4 小时前
HDLBits刷题笔记和一些拓展知识(十一)
开发语言·经验分享·笔记·其他·fpga开发
Better Rose4 小时前
【2025 年第十五届 APMCM数学建模竞赛】B题 问题一、二模型建立与求解
数学建模
njsgcs5 小时前
ParaCAD 笔记 png 图纸标注数据集
笔记
Andy杨5 小时前
20250710-2-Kubernetes 集群部署、配置和验证-网络组件存在的意义?_笔记
网络·笔记·kubernetes
DKPT6 小时前
Java设计模式之行为型模式(责任链模式)介绍与说明
java·笔记·学习·观察者模式·设计模式
崔高杰7 小时前
微调性能赶不上提示工程怎么办?Can Gradient Descent Simulate Prompting?——论文阅读笔记
论文阅读·人工智能·笔记·语言模型
KhalilRuan7 小时前
Unity Demo——3D平台跳跃游戏笔记
笔记·游戏·unity·游戏引擎
Smilecoc8 小时前
线性回归原理推导与应用(十):逻辑回归多分类实战
分类·逻辑回归·线性回归