数学建模-多元线性回归笔记

数学建模笔记

1.学模型✅

2.看专题论文并复习算法

  • 多元线性回归

    • 无偏性:预测值与真实值非常接近
    • 一致性:样本量无限增大,收敛于待估计参数的真值
    • 如何做:控制核心解释变量和u不相关
  • 四类模型回归系数的解释

    • 截距项不用考虑
    • 一元线性回归:y = a + bx + u
      • x每增加1个单位,y平均变化b个单位
    • 双对数模型:lny = a + blnx + u
      • x每增加1%,y平均变化b%
    • 半对数模型:y = a + blnx
      • x每增加1%,y平均变化b/100个单位
    • 半对数模型:lny = a + bx
      • x每增加1个单位,y平均变化(100b)%
  • 算回归系数要避免多重共线性

  • 客户对产品的关注度可以利用爬虫爬取评价量来表示

  • 多元线性回归 软件:STATA

    • 导入数据
    • 描述性统计:
      • 定量数据:summarize 评价量
        • 右键,复制表格
      • 定性数据:tabulate 变量名,<gen(A)>
        • 数据编辑器
    • 打开do文件,运行一部分
    • 回归数据说明
      • 外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-weXrLv8R-1692215418652)(media/16921742285760/16921799343967.jpg)

  • STATA回归

    • regress y x1 x2 ... xk(默认用OLS:普通最小二乘法)
    • 加入虚拟变量(定类变量)
      • regress y x1 G1 G2 G3 G4
  • 结果分析

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-JvvgaXYh-1692215418654)(media/16921742285760/16921809215912.jpg)

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-1r8mMi44-1692215418654)(media/16921742285760/16921818296992.jpg)

P值小于0.05, 说明模型在95%的水平下拒绝原假设,通过了联合显著性检验,说明模型是合理的。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-OraqDFUn-1692215418655)(media/16921742285760/16921809359312.jpg)

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0iMtwXmo-1692215418656)(media/16921742285760/16921818370769.jpg)

先看哪些值是显著的,选择置信水平,然后选择变量,开始分析。

选择置信水平为90%,这里有两个变量是显著的,团购价在其他变量不变的情况下,每增加一元,评价量减小-29.77。控制其他变量不变的情况下,分类为羊奶粉的变量比分类为牛奶粉的评价量高14894.

  • 把回归结果保存到word中

    • est store m1
    • reg2docx m1 using m1.docx, replace
    • // *** p<0.01 ** p<0.05 * p<0.1

      外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tyVdON0T-1692215418656)(media/16921742285760/16921824817070.jpg)

    • 加上右下角的标记
  • excel数据透视图会了,数据处理能超过大部分人

  • 回归分为解释型回归和预测型回归。

    • 预测型回归一般才会更看重R^2。
    • 解释型回归更多的关注模型整体显著性以及自变量的统计显著性和经济意义显著性即可。
  • 为了更为精准的研究影响评价量的重要因素(去除量纲的影响),我们可考虑使用标准化回归系数。

  • 对数据进行标准化,就是将原始数据减去它的均数后,再除以该变量的标准差,计算得到新的变量值,新变量构成的回归方程称为标准化回归方程,回归后相应可得到标准化回归系数。

  • 标准化系数的绝对值越大,说明对因变量的影响就越大(只关注显著的回归系数哦)

  • 回归标准化后得到的系数得到影响程度,不标准化得到的系数才能拿来预测。

  • 标准化回归的命令

    • regress y x1 x2 ... xk, beta
    • 系数是最后一列

      外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-S1WGFZYK-1692215418656)(media/16921742285760/16921833650579.jpg)

  • 结果阅读:在显著的前提下,绝对值要大

  • 归一化后算得的系数会不好解释

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-gQBRMqSe-1692215443131)(https://cdn.jsdelivr.net/gh/jixiuy/clouding/image-20230817034835596.png)

这篇文章还没有配置图层利用 PicGo+Typora+Github

相关推荐
冷雨夜中漫步2 小时前
Python快速入门(6)——for/if/while语句
开发语言·经验分享·笔记·python
Gain_chance4 小时前
34-学习笔记尚硅谷数仓搭建-DWS层最近一日汇总表建表语句汇总
数据仓库·hive·笔记·学习·datagrip
Gain_chance6 小时前
36-学习笔记尚硅谷数仓搭建-DWS层数据装载脚本
大数据·数据仓库·笔记·学习
肖永威6 小时前
macOS环境安装/卸载python实践笔记
笔记·python·macos
暗光之痕6 小时前
Unreal5研究笔记 Actor的生命周期函数
笔记·unreal engine
Gain_chance7 小时前
35-学习笔记尚硅谷数仓搭建-DWS层最近n日汇总表及历史至今汇总表建表语句
数据库·数据仓库·hive·笔记·学习
宵时待雨7 小时前
STM32笔记归纳9:定时器
笔记·stm32·单片机·嵌入式硬件
m0_719084118 小时前
React笔记张天禹
前端·笔记·react.js
r i c k10 小时前
数据库系统学习笔记
数据库·笔记·学习
shandianchengzi11 小时前
【小白向】错位排列|图文解释公考常见题目错位排列的递推式Dn=(n-1)(Dn-2+Dn-1)推导方式
笔记·算法·公考·递推·排列·考公