数学建模-多元线性回归笔记

数学建模笔记

1.学模型✅

2.看专题论文并复习算法

  • 多元线性回归

    • 无偏性:预测值与真实值非常接近
    • 一致性:样本量无限增大,收敛于待估计参数的真值
    • 如何做:控制核心解释变量和u不相关
  • 四类模型回归系数的解释

    • 截距项不用考虑
    • 一元线性回归:y = a + bx + u
      • x每增加1个单位,y平均变化b个单位
    • 双对数模型:lny = a + blnx + u
      • x每增加1%,y平均变化b%
    • 半对数模型:y = a + blnx
      • x每增加1%,y平均变化b/100个单位
    • 半对数模型:lny = a + bx
      • x每增加1个单位,y平均变化(100b)%
  • 算回归系数要避免多重共线性

  • 客户对产品的关注度可以利用爬虫爬取评价量来表示

  • 多元线性回归 软件:STATA

    • 导入数据
    • 描述性统计:
      • 定量数据:summarize 评价量
        • 右键,复制表格
      • 定性数据:tabulate 变量名,<gen(A)>
        • 数据编辑器
    • 打开do文件,运行一部分
    • 回归数据说明
      • 外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-weXrLv8R-1692215418652)(media/16921742285760/16921799343967.jpg)

  • STATA回归

    • regress y x1 x2 ... xk(默认用OLS:普通最小二乘法)
    • 加入虚拟变量(定类变量)
      • regress y x1 G1 G2 G3 G4
  • 结果分析

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-JvvgaXYh-1692215418654)(media/16921742285760/16921809215912.jpg)

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-1r8mMi44-1692215418654)(media/16921742285760/16921818296992.jpg)

P值小于0.05, 说明模型在95%的水平下拒绝原假设,通过了联合显著性检验,说明模型是合理的。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-OraqDFUn-1692215418655)(media/16921742285760/16921809359312.jpg)

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0iMtwXmo-1692215418656)(media/16921742285760/16921818370769.jpg)

先看哪些值是显著的,选择置信水平,然后选择变量,开始分析。

选择置信水平为90%,这里有两个变量是显著的,团购价在其他变量不变的情况下,每增加一元,评价量减小-29.77。控制其他变量不变的情况下,分类为羊奶粉的变量比分类为牛奶粉的评价量高14894.

  • 把回归结果保存到word中

    • est store m1
    • reg2docx m1 using m1.docx, replace
    • // *** p<0.01 ** p<0.05 * p<0.1

      外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tyVdON0T-1692215418656)(media/16921742285760/16921824817070.jpg)

    • 加上右下角的标记
  • excel数据透视图会了,数据处理能超过大部分人

  • 回归分为解释型回归和预测型回归。

    • 预测型回归一般才会更看重R^2。
    • 解释型回归更多的关注模型整体显著性以及自变量的统计显著性和经济意义显著性即可。
  • 为了更为精准的研究影响评价量的重要因素(去除量纲的影响),我们可考虑使用标准化回归系数。

  • 对数据进行标准化,就是将原始数据减去它的均数后,再除以该变量的标准差,计算得到新的变量值,新变量构成的回归方程称为标准化回归方程,回归后相应可得到标准化回归系数。

  • 标准化系数的绝对值越大,说明对因变量的影响就越大(只关注显著的回归系数哦)

  • 回归标准化后得到的系数得到影响程度,不标准化得到的系数才能拿来预测。

  • 标准化回归的命令

    • regress y x1 x2 ... xk, beta
    • 系数是最后一列

      外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-S1WGFZYK-1692215418656)(media/16921742285760/16921833650579.jpg)

  • 结果阅读:在显著的前提下,绝对值要大

  • 归一化后算得的系数会不好解释

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-gQBRMqSe-1692215443131)(https://cdn.jsdelivr.net/gh/jixiuy/clouding/image-20230817034835596.png)

这篇文章还没有配置图层利用 PicGo+Typora+Github

相关推荐
LinXunFeng2 天前
Obsidian - 使用 Share Note 分享笔记并自部署
前端·笔记·github
闪闪发亮的小星星6 天前
高斯光以及高斯光公式解释
笔记
cqbzcsq6 天前
CellFlow虚拟细胞论文阅读
论文阅读·人工智能·笔记·学习·生物信息
阿米亚波6 天前
【Windows】QEMU 启动 openEuler aarch64/arm64 架构系统 + 离线软件源
linux·windows·经验分享·笔记·架构·arm
自传.6 天前
尚硅谷 Vibe Coding|第三章(1) Claude Code深度使用与进阶技巧 学习笔记
笔记·学习·尚硅谷·vibecoding
老余捞鱼6 天前
线性回归实战:5步验证你的量化因子是否真有效
算法·金融·回归·线性回归·ai量化
.千余6 天前
【C++】模板进阶全解:非类型参数|全特化|偏特化|分离编译完全指南
开发语言·c++·笔记·学习·其他
自传.6 天前
尚硅谷 Vibe Coding|第二章 AI编程工具生态 学习笔记
笔记·学习·ai编程·尚硅谷·vibe coding
秋波。未央6 天前
Java Agent 开发 · Day 1 学习笔记(含作业完整标准答案)
java·笔记·学习
兜里只有三分钱~6 天前
快递索赔场景评测|魔珐星云职场法务数字人线下落地实测
数学建模·数字人·数字