【机器学习】回归类算法-相关性分析

一、前言

前面的几篇博客我们学习了分类算法,今天我们来了解一下回归类的算法吧。首先我们来谈谈两者有什么区别,首先是我们在之前的分类算法,这类算法可以将让我们学会如何将不同的数据划分到不同的类里面,输出的是一些离散的值。而今天要学习的回归类算法,是说经过算法的预测将我们得到的结果是一个连续的值,其实是我们常说的函数关系。

二、相关关系

(1)概念

在谈回归(函数)关系之前,先讲一讲,相关关系,因为回归是一种研究自变量(x)与因变量(y)之间的关系形式的分析方法。而谈到变量之间的关系就分成回归关系和相关关系两类。今天我们就先谈谈相关关系。

定义:反映事物之间的非严格、不确定的线性依存关系。

特点①:

事物之间存在的一种**内在联系。**即一个事物的数量改变可以引起另一个事物的对应数量发生改变。这其实好理解

特点②:

事物之间的的这种依存关系是不确定的,是有随机性的。比较明显的一点就是我们的自变量(x)可能对应对个因变量(y),这和我们的函数关系,多个x可以对应一个y的情形是不一样的。这是因为影响y变化的因素不只是x,可能还有其他的因素。

(2)实现公式

三、相关关系实践

求一下数据的之间的相关关系:

python 复制代码
import numpy as np
import pandas as pd


A = [250, 360, 165, 43, 92, 200, 355, 290, 230, 120, 73, 205, 400, 320, 72, 272, 94, 190, 235, 139]
B = [35, 29, 36, 60, 65, 30, 10, 70, 21, 55, 54, 48, 20, 39, 60, 20, 58, 40, 27, 30]
C = [3, 4, 7, 6, 5, 5, 6, 10, 9, 2, 12, 5, 5, 4, 8, 5, 7, 8, 9, 7]
D = [6, 10, 3, 9, 6, 5, 7, 10, 11, 5, 4, 1, 15, 7, 6, 8, 3, 11, 8, 5]

df = pd.DataFrame({'取暖费': np.array(A), '温度': np.array(B), '厚度': np.array(C), '年数': np.array(D)})
# 显示分装好的数据
print(df)
# 显示所有数据之间的相关关系
print(df.corr())
# 显示键为'温度'的对应的数据之间的相关关系
print(df.corr()[u'温度'])
# 显示'取暖费'与'温度'之间的相似关系
print(df[u'取暖费'].corr(df[u'温度']))

效果:

如上面的代码所示,我们采用pandas库中的corr()方法就可以直接实现上面那个复杂关于相关性运算的公式!

四、总结

博主也是初学者,有很多不懂的地方,如果有说错的地方,欢迎大家指正。最后,该内容是跟着**B站up主【abilityjh】**老师学习的,大家可以去看该老师的视频学习!

相关推荐
攻城狮7号13 小时前
腾讯混元翻译模型Hunyuan-MT-7B开源,先前拿了30个冠军
人工智能·hunyuan-mt-7b·腾讯混元翻译模型·30个冠军
zezexihaha14 小时前
从“帮写文案”到“管生活”:个人AI工具的边界在哪?
人工智能
算家云14 小时前
nano banana官方最强Prompt模板来了!六大场景模板详解
人工智能·谷歌·ai大模型·算家云·ai生图·租算力,到算家云·nano banana 提示词
暴躁的大熊14 小时前
AI助力决策:告别生活与工作中的纠结,明析抉择引领明智选择
人工智能
Gyoku Mint14 小时前
提示词工程(Prompt Engineering)的崛起——为什么“会写Prompt”成了新技能?
人工智能·pytorch·深度学习·神经网络·语言模型·自然语言处理·nlp
梁小憨憨14 小时前
zotero扩容
人工智能·笔记
民乐团扒谱机14 小时前
逻辑回归算法干货详解:从原理到 MATLAB 可视化实现
数学建模·matlab·分类·数据挖掘·回归·逻辑回归·代码分享
大数据张老师14 小时前
AI架构师的思维方式与架构设计原则
人工智能·架构师·ai架构·后端架构
AKAMAI14 小时前
Entity Digital Sports 降低成本并快速扩展
人工智能·云计算
m0_6176636214 小时前
Deeplizard深度学习课程(七)—— 神经网络实验
人工智能·深度学习·神经网络