线性回归笔记

线性回归简介

  1. 定义:通过属性的线性组合进行预测的线性模型,目标是找到一条直线、平面或更高维的超平面,使预测值与真实值的误差最小化。
  2. 示例:如房屋价格预测,可用函数f(x)=W0+W1x表示,其中x为房屋大小,f(x)为价格。
  3. 一般形式
    • 对于由d个属性描述的示例x=(x1;x2;⋯;xd),线性模型函数为f(x)=w1x1+w2x2+⋯+wdxd+b。
    • 向量形式:f(x)=wTx+b。
  4. 最小二乘法:基于均方误差最小化进行模型求解的方法,均方误差对应 "欧氏距离",其试图找到一条直线,使所有样本到直线的欧氏距离之和最小。

二、线性回归的评估指标

  1. 误差平方和 / 残差平方和(SSE/RSS):SSE=∑i=1m(yi−y^i)2
  2. 平方损失 / 均方误差(MSE):MSE=n1∑i=1n(yi−y^i)2
  3. R 方:越接近 1,模型拟合效果越好。
    • 计算公式:R2=1−∑(yi−yˉ)2∑(yi−y^i)2=1−SSTSSE,也可表示为R2=1−VarMSE。
    • 其中,SSR=∑(y^i−yˉ)2,SSE=∑(yi−y^i)2,SST=∑(yi−yˉ)2。

三、线性模型一般形式及参数估计

  1. 对于样本xi,模型为f(xi)=wxi+b,要使f(xi)≃yi。
  2. 参数估计:求w和b使E(w,b)=∑i=1n(yi−wxi−b)2最小化,此过程称为线性回归模型的最小二乘 "参数估计"。
  3. 求解:将E(w,b)分别对w和b求导,令导数为 0,可得到w和b的最优解。

四、多元线性回归

  1. 表达式:y=w0+w1x1+w2x2+⋯+wnxn
  2. 涉及多属性数据,可通过矩阵等形式进行表示和计算。
相关推荐
free-elcmacom21 分钟前
机器学习高阶教程<5>当机器学习遇上运筹学:破解商业决策的“终极难题”
人工智能·python·机器学习
Wang ruoxi34 分钟前
基于最小二乘法的离散数据拟合
人工智能·算法·机器学习
一招定胜负1 小时前
决策树开篇
算法·决策树·机器学习
carver w1 小时前
说人话版 K-means 解析
算法·机器学习·kmeans
ASS-ASH1 小时前
机器人灵巧手:技术演进、市场格局与未来前景
人工智能·深度学习·神经网络·机器学习·计算机视觉·机器人·灵巧手
weixin_395448911 小时前
TDA4工程和tda2工程相比,数据预处理部分tda4有哪些升级?带来了什么好处,tda2原来的数据预处理有哪些坏处
人工智能·python·机器学习
薛不痒1 小时前
机器学习算法之决策树
人工智能·决策树·机器学习
还不秃顶的计科生1 小时前
A100,A800,H100,H800之间的比较
深度学习·机器学习·联邦学习
OpenBayes2 小时前
教程上新丨微软开源VibeVoice,可实现90分钟4角色自然对话
人工智能·深度学习·机器学习·大语言模型·tts·对话生成·语音生成
weixin_404679312 小时前
pytorch nn.Parameter self.register_parameter() 区别
人工智能·pytorch·python·深度学习·机器学习