Python 和 Seaborn

文章目录

Seaborn是一个流行的Python数据可视化库,它建立在Matplotlib基础之上,提供了更高级别的接口和更美观的默认样式,使得用户能够更容易地创建统计图形。Seaborn专注于统计数据的可视化,支持创建如散点图、折线图、柱状图、热图等多种统计图表,并且与Pandas数据结构紧密集成,便于数据分析和可视化。

python3 复制代码
import seaborn as sns

此外,Seaborn还有许多用于数据处理和可视化的函数,例如sns.load_dataset用于加载内置数据集,sns.scatterplotsns.lineplotsns.barplot等用于创建不同类型的图表,以及sns.heatmap用于创建热力图等。

1. 整体布局风格设置

使用 matplotlib 模块绘制。

python3 复制代码
import seaborn as sns
import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt

def sinplot(flip=1):
    x = np.linspace(0, 14, 100)
    for i in range(1, 7):
        plt.plot(x, np.sin(x + i*0.5)*(7 - i) * flip)
sinplot()
plt.show()

问:我们知道,matplotlib 绘图时需要调整非常多的参数实现图像控制,那么有没有什么好的办法可以不用这么麻烦呢?

答:使用 seaborn 预设主题就好了。

python3 复制代码
import seaborn as sns
import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt

def sinplot(flip=1):
    x = np.linspace(0, 14, 100)
    for i in range(1, 7):
        plt.plot(x, np.sin(x + i*0.5)*(7 - i) * flip)

sns.set() # 默认设置
sinplot()
plt.show()

5 种主题风格:

  • darkgrid
  • whitegrid
  • dark
  • white
  • ticks

风格设置语句

sns.set_style("whitegrid")

python3 复制代码
import seaborn as sns
import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt

def sinplot(flip=1):
    x = np.linspace(0, 14, 100)
    for i in range(1, 7):
        plt.plot(x, np.sin(x + i*0.5)*(7 - i) * flip)

sns.set_style("darkgrid")
sinplot()
plt.show()

设置图像距离坐标轴的位置

sns.despine(offset=50)

python3 复制代码
import seaborn as sns
import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt

def sinplot(flip=1):
    x = np.linspace(0, 14, 100)
    for i in range(1, 7):
        plt.plot(x, np.sin(x + i*0.5)*(7 - i) * flip)

sns.set_style("dark")
sinplot()
sns.despine(offset=50)
plt.show()

不同子图使用不同风格

python3 复制代码
import seaborn as sns
import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt

def sinplot(flip=1):
    x = np.linspace(0, 14, 100)
    for i in range(1, 7):
        plt.plot(x, np.sin(x + i*0.5)*(7 - i) * flip)

with sns.axes_style("darkgrid"):
    plt.subplot(211)
    sinplot()
plt.subplot(212)
sinplot(-1)
plt.show()

2. 调色板

  • color_palette() 能传入任何 Matplotlib 所支持的颜色。
  • color_palette() 不写参数则默认颜色。
  • set_palette() 设置所有图的颜色。

十个默认的颜色循环主题,如果不指定画图颜色,则默认循环使用这十种颜色。

问:如果只会 10 个颜色的英文单词,但是面对 10 以上分类情况怎么办?

答:使用圆形画板方式。

圆形画板

当需要十个以上的分类需要区分时,最简单的方法就是在一个圆形的颜色空间中画出均匀间隔的颜色(这样的色调会保持光度和饱和度不变),这是大多数当需要使用比当前默认颜色循环中设置的颜色更多时的默认方案。

最常用的方法是使用 hls 的颜色空间,是 RGB 值的一个简单转换。

python3 复制代码
current_palette = sns.color_palette("hls", 20)
sns.palplot(current_palette)
plt.show()

如何使用这些颜色?

python3 复制代码
data = np.random.normal(size=(20, 12)) + np.arange(12)/2
sns.boxplot(data=data, palette=sns.color_palette('hls', 12))
plt.show()

3. 单变量分析图

直方图绘制

python3 复制代码
sns.set(color_codes=True)
np.random.seed(sum(map(ord, "distributions")))
x = np.random.normal(size=100) # 数据
sns.displot(x, kde=False) # 绘制直方图,kde是否核密度估计,无需指定任何参数
plt.show()

指定 bins。

python3 复制代码
sns.set(color_codes=True)
np.random.seed(sum(map(ord, "distributions")))
x = np.random.normal(size=100) # 数据
sns.displot(x, kde=False) # 绘制直方图,kde是否核密度估计,无需指定任何参数
sns.displot(x, bins=20, kde=False) # 指定bins
plt.show()

问:两个变量之间的关系如何表现?

答:散点图。

根据均值和协方差生成数据。

python3 复制代码
mean, cov = [0, 1], [(1, 0.5), (0.5, 1)]
data = np.random.multinomial_normal(mean, cov, 200)
df = pd.DataFrame(data, columns=['x', 'y'])

观测两个变量之间的分布关系最好用散点图。

python3 复制代码
sns.set(color_codes=True)
# 均值和协方差
mean, cov = [0, 1], [(1, 0.5), (0.5, 1)]
data = np.random.multivariate_normal(mean, cov, 200)
df = pd.DataFrame(data, columns=['x', 'y'])
sns.jointplot(x='x', y='y', data=df) # 将散点图和x/y直方图均绘制出来
plt.show()

散点图中每个点的大小都一致,数据量较大时,堆叠在一起,存在弊端。

另一种表现方式------蜂窝图。

python3 复制代码
sns.set(color_codes=True)
# 均值和协方差
mean, cov = [0, 1], [(1, 0.5), (0.5, 1)]
x, y = np.random.multivariate_normal(mean, cov, 1000).T
with sns.axes_style("white"):
    sns.jointplot(x=x, y=y, kind="hex", color="k")
plt.show()
相关推荐
Cachel wood13 分钟前
python round四舍五入和decimal库精确四舍五入
java·linux·前端·数据库·vue.js·python·前端框架
終不似少年遊*19 分钟前
pyecharts
python·信息可视化·数据分析·学习笔记·pyecharts·使用技巧
Python之栈20 分钟前
【无标题】
数据库·python·mysql
袁袁袁袁满36 分钟前
100天精通Python(爬虫篇)——第113天:‌爬虫基础模块之urllib详细教程大全
开发语言·爬虫·python·网络爬虫·爬虫实战·urllib·urllib模块教程
老大白菜1 小时前
Python 爬虫技术指南
python
古希腊掌管学习的神2 小时前
[搜广推]王树森推荐系统——矩阵补充&最近邻查找
python·算法·机器学习·矩阵
LucianaiB3 小时前
探索CSDN博客数据:使用Python爬虫技术
开发语言·爬虫·python
PieroPc5 小时前
Python 写的 智慧记 进销存 辅助 程序 导入导出 excel 可打印
开发语言·python·excel
梧桐树04299 小时前
python常用内建模块:collections
python
Dream_Snowar9 小时前
速通Python 第三节
开发语言·python