Seaborn 回归(Regression)及矩阵(Matrix)绘图

Seaborn中的回归包括回归拟合曲线图以及回归误差图。
Matrix图主要是热度图。

1. 回归及矩阵绘图API概述

seaborn中"回归"绘图函数共3个:

lmplot(回归统计绘图):figure级regplot函数,绘图同regplot完全相同。(lm指linear model)

  • regplot:axes级函数。绘制线性回归拟合。
  • residplot:axes级函数。绘制线性回归的误差图。(不能用lmplot绘制resid图)

seaborn中矩阵绘图函数共有2个:

  • heatmap:axes级函数。热度图,绘制一个颜色块矩阵。
  • clustermap:figure级函数。聚合热度图,绘制一个分层聚合的热度图。

figure级函数与axes级函数区别见Seaborn系列(一):绘图基础、函数分类、长短数据类型支持

2. 回归统计绘图

2.1 lmplot、regplot绘图

  • sns.lmplot(x=None,y=None,data=None):绘制线性回归拟合图,返回FacetGrid
  • sns.regplot(x=None,y=None,data=None)绘制线性回归拟合图,返回Axes
    • hue:分系列用不同的颜色绘制
    • col,row:指定参数不同值绘制到不同的行或列。
    • ci=95:置信区间的大小,取值0-100
    • order:指定拟合多项式阶数
    • scatter:是否绘制散点图
    • x_jitter,y_jitter:为x变量或y变量添加随机噪点。会导致绘制的散点移动,不会改变原始数据。
    • x_estimator:参数值为函数,如np.mean。对每个x值的所有y值用函数计算,绘制得到的点,并绘制误差线。
    • x_bins:当x不是离散值时x_estimator可以配合x_bins指定计算点和误差线数量
    • robust:对异常值降低权重
    • logistic:logistic=True时,假设y取值只有2个比如True和False,并用statsmodels中的逻辑回归模型回归。

sns.lmplot(data=tips, x="total_bill", y="tip")

hue、col、row参数与其他函数用法相同

sns.lmplot(data=tips, x="total_bill", y="tip", hue="sex", col="smoker")

图中拟合直线旁边透明颜色带是回归估计的置信区间,默认置信区间为95%。ci参数可以设置置信区间,ci取None则不绘制置信区间。

sns.lmplot(data=tips, x="total_bill", y="tip", ci=50)

sns.lmplot(data=tips, x="total_bill", y="tip", order=3)

sns.lmplot(data=tips, x="total_bill", y="tip", scatter=False)

x_jitter会随机改变图中散点的x坐标,y_jitter会随机改变图中散点的y坐标。

sns.lmplot(data=tips, x="total_bill", y="tip", y_jitter=10)

sns.lmplot(data=tips, x="total_bill", y="tip", x_estimator=np.mean, x_bins=4)

``

robust参数为True时,会降低异常值的权重,在需要剔除异常值时,非常有用。
但是使用robust后,计算量会比较大,通常建议取ci=None加速。
注意robust参数需要安装statsmodels模块。

prettyprint 复制代码
<span style="color:#333333"><span style="background-color:#f9f5e9"><code>import matplotlib.pyplot as plt
import seaborn as sns
ans = sns.load_dataset("anscombe")
dat = ans.loc[ans.dataset == "III"]

sns.lmplot(data=dat, x="x", y="y", robust=True, ci=None)

plt.show()
</code></span></span>

2.2 residplot绘图

  • sns.residplot(x=None,y=None,data=None)绘制线性回归拟合图的残差
    • order:回归拟合阶数
    • robust:对异常值降低权重
    • dropna:忽略空值
prettyprint 复制代码
<span style="color:#333333"><span style="background-color:#f9f5e9"><code>sns.residplot(data=tips, x="total_bill", y="tip")
</code></span></span>

3. 矩阵图

3.1 heatmap热力图

  • sns.residplot(data):绘制热力图
    • annot:在单元格内显示数据。
    • fmt:设置annot参数数据显示格式。
    • cbar:是否显示颜色条。
    • cmap:设置colormap。
    • square:单元格是否方形。
    • linewidths:设置单元格线条宽度。
    • linecolor:设置单元格线条颜色。
prettyprint 复制代码
<span style="color:#333333"><span style="background-color:#f9f5e9"><code>import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
data = np.random.rand(10, 10)

sns.heatmap(data=data)

plt.show()
</code></span></span>
prettyprint 复制代码
<span style="color:#333333"><span style="background-color:#f9f5e9"><code>sns.heatmap(data=data, annot=True, fmt=".2f")
</code></span></span>
prettyprint 复制代码
<span style="color:#333333"><span style="background-color:#f9f5e9"><code>sns.heatmap(data=data, cmap="hsv", cbar=False, linewidths=0.5, linecolor="w")
</code></span></span>

3.2 clustermap分层聚合热力图

prettyprint 复制代码
<span style="color:#333333"><span style="background-color:#f9f5e9"><code>import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
data = np.random.rand(10, 10)

sns.clustermap(data=data)

plt.show()
</code></span></span>

clustermap说明详见Python可视化matplotlib&seborn15-聚类热图clustermap(建议收藏) - 知乎

相关推荐
会的全对٩(ˊᗜˋ*)و1 小时前
【数据挖掘】数据挖掘综合案例—银行精准营销
人工智能·经验分享·python·数据挖掘
kngines2 小时前
【字节跳动】数据挖掘面试题0007:Kmeans原理,何时停止迭代
人工智能·数据挖掘·kmeans
陈敬雷-充电了么-CEO兼CTO4 小时前
推荐算法系统系列>推荐数据仓库集市的ETL数据处理
大数据·数据库·数据仓库·数据挖掘·数据分析·etl·推荐算法
麻雀无能为力5 小时前
CAU数据挖掘 支持向量机
人工智能·支持向量机·数据挖掘·中国农业大学计算机
IT古董5 小时前
【第二章:机器学习与神经网络概述】04.回归算法理论与实践 -(3)决策树回归模型(Decision Tree Regression)
神经网络·机器学习·回归
szekl8 小时前
HDMI 2.0 4×2矩阵切换器412HN——多信号输入输出的高清解决方案
linux·矩阵·计算机外设·电脑·ekl
顾道长生'1 天前
(Arxiv-2024)自回归模型优于扩散:Llama用于可扩展的图像生成
计算机视觉·数据挖掘·llama·自回归模型·多模态生成与理解
kngines1 天前
【字节跳动】数据挖掘面试题0006:SVM(支持向量机)详细原理
算法·支持向量机·数据挖掘·svm
好开心啊没烦恼1 天前
Python:线性代数,向量内积谐音记忆。
开发语言·python·线性代数·数据挖掘·数据分析
过期的秋刀鱼!1 天前
用“做饭”理解数据分析流程(Excel三件套实战)
数据挖掘·数据分析·excel·powerbi·数据分析入门