【深度学习】第3章实验——回归模型

根据相关数据集进行回归分析

python 复制代码
import statsmodels.api as sm
# df.loc[:, ...] 表示选择所有行。
# df.columns != 'mpg' 创建一个布尔数组,指示哪些列不等于 'mpg'。
# df.loc[:, df.columns != 'mpg'] 选择 df 中所有行和列名不等于 'mpg' 的所有列。
x =df.loc[:,df.columns!='mpg']

#在数据框 x 中添加一列常数值(通常为 1)。
#这一列称为截距项(intercept),在回归分析中非常重要。
#这样做的目的是确保模型在进行线性回归时,包括一个常数项(截距)。
x=sm.add_constant(x)
y = df['mpg']

# 随机抽取 x 数据框中的 6 行数据。
x.sample(6)
python 复制代码
import statsmodels.formula.api as smf

#smf.ols 是使用普通最小二乘法(OLS)进行线性回归分析的函数。
#formula='mpg~hp+C(vs)+C(am)' 定义了回归模型的公式
#mpg 是因变量(或目标变量),即我们要预测的变量。
#hp 是自变量之一,即预测变量。
#C(vs) 和 C(am) 表示 vs 和 am 是分类变量(categorical variables)。C 函数将这些变量视为分类变量,而不是连续变量。
#data=df 指定了数据源 df
#.fit() 方法用于拟合模型,即根据提供的数据进行线性回归分析,并生成一个包含拟合结果的模型对象。
model = smf.ols(formula='mpg~hp+C(vs)+C(am)',data=df).fit()

#打印模型摘要
print(model.summary())
python 复制代码
#使用先前拟合的线性回归模型对新的数据进行预测
y_hat = model.predict(x)
#随机抽取并展示5个预测值:
y_hat.sample(5)
python 复制代码
import numpy as np
#计算模型预测结果的均方根误差
#反映了预测值与实际值之间的差异大小
model_RMSE = np.sqrt(np.mean(np.square(y_hat-y)))
model_RMSE
python 复制代码
fig = plt.figure(figsize=(12,8))
#使用 plot_regress_exog 函数来绘制回归模型的外生变量(exogenous variable)的回归诊断图
fig = sm.graphics.plot_regress_exog(model,"hp",fig = fig)
相关推荐
kakaZhui3 分钟前
【llm对话系统】大模型源码分析之 LLaMA 位置编码 RoPE
人工智能·深度学习·chatgpt·aigc·llama
struggle20251 小时前
一个开源 GenBI AI 本地代理(确保本地数据安全),使数据驱动型团队能够与其数据进行互动,生成文本到 SQL、图表、电子表格、报告和 BI
人工智能·深度学习·目标检测·语言模型·自然语言处理·数据挖掘·集成学习
佛州小李哥1 小时前
通过亚马逊云科技Bedrock打造自定义AI智能体Agent(上)
人工智能·科技·ai·语言模型·云计算·aws·亚马逊云科技
云空2 小时前
《DeepSeek 网页/API 性能异常(DeepSeek Web/API Degraded Performance):网络安全日志》
运维·人工智能·web安全·网络安全·开源·网络攻击模型·安全威胁分析
AIGC大时代2 小时前
对比DeepSeek、ChatGPT和Kimi的学术写作关键词提取能力
论文阅读·人工智能·chatgpt·数据分析·prompt
山晨啊83 小时前
2025年美赛B题-结合Logistic阻滞增长模型和SIR传染病模型研究旅游可持续性-成品论文
人工智能·机器学习
一水鉴天4 小时前
为AI聊天工具添加一个知识系统 之77 详细设计之18 正则表达式 之5
人工智能·正则表达式
davenian4 小时前
DeepSeek-R1 论文. Reinforcement Learning 通过强化学习激励大型语言模型的推理能力
人工智能·深度学习·语言模型·deepseek
X.AI6664 小时前
【大模型LLM面试合集】大语言模型架构_llama系列模型
人工智能·语言模型·llama
CM莫问4 小时前
什么是门控循环单元?
人工智能·pytorch·python·rnn·深度学习·算法·gru