Python 和 Seaborn

文章目录

Seaborn是一个流行的Python数据可视化库,它建立在Matplotlib基础之上,提供了更高级别的接口和更美观的默认样式,使得用户能够更容易地创建统计图形。Seaborn专注于统计数据的可视化,支持创建如散点图、折线图、柱状图、热图等多种统计图表,并且与Pandas数据结构紧密集成,便于数据分析和可视化。

python3 复制代码
import seaborn as sns

此外,Seaborn还有许多用于数据处理和可视化的函数,例如sns.load_dataset用于加载内置数据集,sns.scatterplotsns.lineplotsns.barplot等用于创建不同类型的图表,以及sns.heatmap用于创建热力图等。

1. 整体布局风格设置

使用 matplotlib 模块绘制。

python3 复制代码
import seaborn as sns
import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt

def sinplot(flip=1):
    x = np.linspace(0, 14, 100)
    for i in range(1, 7):
        plt.plot(x, np.sin(x + i*0.5)*(7 - i) * flip)
sinplot()
plt.show()

问:我们知道,matplotlib 绘图时需要调整非常多的参数实现图像控制,那么有没有什么好的办法可以不用这么麻烦呢?

答:使用 seaborn 预设主题就好了。

python3 复制代码
import seaborn as sns
import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt

def sinplot(flip=1):
    x = np.linspace(0, 14, 100)
    for i in range(1, 7):
        plt.plot(x, np.sin(x + i*0.5)*(7 - i) * flip)

sns.set() # 默认设置
sinplot()
plt.show()

5 种主题风格:

  • darkgrid
  • whitegrid
  • dark
  • white
  • ticks

风格设置语句

sns.set_style("whitegrid")

python3 复制代码
import seaborn as sns
import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt

def sinplot(flip=1):
    x = np.linspace(0, 14, 100)
    for i in range(1, 7):
        plt.plot(x, np.sin(x + i*0.5)*(7 - i) * flip)

sns.set_style("darkgrid")
sinplot()
plt.show()

设置图像距离坐标轴的位置

sns.despine(offset=50)

python3 复制代码
import seaborn as sns
import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt

def sinplot(flip=1):
    x = np.linspace(0, 14, 100)
    for i in range(1, 7):
        plt.plot(x, np.sin(x + i*0.5)*(7 - i) * flip)

sns.set_style("dark")
sinplot()
sns.despine(offset=50)
plt.show()

不同子图使用不同风格

python3 复制代码
import seaborn as sns
import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt

def sinplot(flip=1):
    x = np.linspace(0, 14, 100)
    for i in range(1, 7):
        plt.plot(x, np.sin(x + i*0.5)*(7 - i) * flip)

with sns.axes_style("darkgrid"):
    plt.subplot(211)
    sinplot()
plt.subplot(212)
sinplot(-1)
plt.show()

2. 调色板

  • color_palette() 能传入任何 Matplotlib 所支持的颜色。
  • color_palette() 不写参数则默认颜色。
  • set_palette() 设置所有图的颜色。

十个默认的颜色循环主题,如果不指定画图颜色,则默认循环使用这十种颜色。

问:如果只会 10 个颜色的英文单词,但是面对 10 以上分类情况怎么办?

答:使用圆形画板方式。

圆形画板

当需要十个以上的分类需要区分时,最简单的方法就是在一个圆形的颜色空间中画出均匀间隔的颜色(这样的色调会保持光度和饱和度不变),这是大多数当需要使用比当前默认颜色循环中设置的颜色更多时的默认方案。

最常用的方法是使用 hls 的颜色空间,是 RGB 值的一个简单转换。

python3 复制代码
current_palette = sns.color_palette("hls", 20)
sns.palplot(current_palette)
plt.show()

如何使用这些颜色?

python3 复制代码
data = np.random.normal(size=(20, 12)) + np.arange(12)/2
sns.boxplot(data=data, palette=sns.color_palette('hls', 12))
plt.show()

3. 单变量分析图

直方图绘制

python3 复制代码
sns.set(color_codes=True)
np.random.seed(sum(map(ord, "distributions")))
x = np.random.normal(size=100) # 数据
sns.displot(x, kde=False) # 绘制直方图,kde是否核密度估计,无需指定任何参数
plt.show()

指定 bins。

python3 复制代码
sns.set(color_codes=True)
np.random.seed(sum(map(ord, "distributions")))
x = np.random.normal(size=100) # 数据
sns.displot(x, kde=False) # 绘制直方图,kde是否核密度估计,无需指定任何参数
sns.displot(x, bins=20, kde=False) # 指定bins
plt.show()

问:两个变量之间的关系如何表现?

答:散点图。

根据均值和协方差生成数据。

python3 复制代码
mean, cov = [0, 1], [(1, 0.5), (0.5, 1)]
data = np.random.multinomial_normal(mean, cov, 200)
df = pd.DataFrame(data, columns=['x', 'y'])

观测两个变量之间的分布关系最好用散点图。

python3 复制代码
sns.set(color_codes=True)
# 均值和协方差
mean, cov = [0, 1], [(1, 0.5), (0.5, 1)]
data = np.random.multivariate_normal(mean, cov, 200)
df = pd.DataFrame(data, columns=['x', 'y'])
sns.jointplot(x='x', y='y', data=df) # 将散点图和x/y直方图均绘制出来
plt.show()

散点图中每个点的大小都一致,数据量较大时,堆叠在一起,存在弊端。

另一种表现方式------蜂窝图。

python3 复制代码
sns.set(color_codes=True)
# 均值和协方差
mean, cov = [0, 1], [(1, 0.5), (0.5, 1)]
x, y = np.random.multivariate_normal(mean, cov, 1000).T
with sns.axes_style("white"):
    sns.jointplot(x=x, y=y, kind="hex", color="k")
plt.show()
相关推荐
墨城烟柳Q10 分钟前
自动化爬虫-selenium模块万字详解
爬虫·python·selenium·自动化
raoxiaoya13 分钟前
python安装selenium,geckodriver,chromedriver
开发语言·python·selenium
Dxy12393102161 小时前
python使用requests发送请求ssl错误
开发语言·python·ssl
gxchai1 小时前
利用pythonstudio写的PDF、图片批量水印生成器,可同时为不同读者生成多组水印
python
ao_lang1 小时前
剑指offer第五天
python·算法·cpp
这个男人是小帅1 小时前
【GCN】 代码详解 (1) 如何运行【pytorch】可运行版本
人工智能·pytorch·python·深度学习·分类
python1562 小时前
Python Pandas内存管理技巧助力高效处理大数据
大数据·python·pandas
Python大数据分析@2 小时前
学习python中的pandas有没有好的教程推荐?
python·学习·pandas
哪 吒2 小时前
华为OD机试 - 无重复字符的元素长度乘积的最大值(Python/JS/C/C++ 2024 C卷 100分)
javascript·python·华为od
科研小达人3 小时前
Langchain调用模型使用FAISS
python·chatgpt·langchain·faiss