Seaborn数据可视化实战:Seaborn颜色与样式定制教程

Seaborn颜色与样式:打造个性化数据可视化

学习目标

在本课程中,我们将深入探讨Seaborn库中颜色和样式设置的技巧,学习如何通过自定义图表的颜色、线条样式、标记样式等,来增强图表的视觉效果,使数据故事更加生动和吸引人。

相关知识点

  • Seaborn颜色与样式

学习内容

1 Seaborn颜色与样式

1.1 颜色设置

颜色是数据可视化中一个非常重要的元素,它不仅能够帮助区分不同的数据集,还能增强图表的视觉吸引力。Seaborn提供了多种方式来设置图表的颜色,包括使用预定义的颜色调色板、自定义颜色以及根据数据值动态选择颜色。

安装环境依赖:

bash 复制代码
%pip install seaborn
  • 预定义的颜色调色板

    Seaborn内置了多个颜色调色板,这些调色板经过精心设计,适用于不同的数据可视化场景。例如,deep调色板适合于区分不同的数据集,而muted调色板则更加柔和,适合于展示数据的细微差异。

python 复制代码
import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np


# 生成模拟数据,这里分为三个类别
n_samples = 100
np.random.seed(42)

# 类别 A 的数据
category_a_size = int(n_samples * 0.3)
total_bill_a = np.random.normal(20, 5, category_a_size)
tip_a = total_bill_a * np.random.uniform(0.15, 0.2, category_a_size)

# 类别 B 的数据
category_b_size = int(n_samples * 0.4)
total_bill_b = np.random.normal(35, 7, category_b_size)
tip_b = total_bill_b * np.random.uniform(0.1, 0.15, category_b_size)

# 类别 C 的数据
category_c_size = n_samples - category_a_size - category_b_size
total_bill_c = np.random.normal(45, 3, category_c_size)
tip_c = total_bill_c * np.random.uniform(0.05, 0.1, category_c_size)

# 合并数据
total_bill = np.concatenate([total_bill_a, total_bill_b, total_bill_c])
tip = np.concatenate([tip_a, tip_b, tip_c])
categories = ['A'] * category_a_size + ['B'] * category_b_size + ['C'] * category_c_size


# 创建 DataFrame
tips = pd.DataFrame({
    "total_bill": total_bill,
    "tip": tip,
    "category": categories
})

# 使用预定义的调色板
sns.set_palette("deep")
sns.scatterplot(x="total_bill", y="tip", data=tips)
plt.title("Using the predefined color palette")
plt.xlabel("Total Bill")
plt.ylabel("Tip")
plt.show()
  • 自定义颜色

    除了使用预定义的调色板,Seaborn还允许用户自定义颜色。这可以通过直接指定颜色值(如十六进制颜色代码)或使用颜色名称来实现。自定义颜色可以更好地匹配特定的设计需求或品牌色彩。

python 复制代码
# 自定义颜色
custom_palette = ["#FF5733", "#33FF57", "#3357FF"]
sns.set_palette(custom_palette)
sns.scatterplot(x="total_bill", y="tip", data=tips)
plt.title("Use custom colors")
plt.show()
  • 根据数据值动态选择颜色

    在某些情况下,我们可能希望根据数据值的变化来动态选择颜色。Seaborn通过hue参数支持这一功能,可以将颜色映射到数据中的某个变量,从而更直观地展示数据的分布和关系。

python 复制代码
# 根据数据值动态选择颜色
sns.scatterplot(x="total_bill", y="tip", hue="category", data=tips)
plt.title("Dynamically select colors based on data values")
plt.show()

1.2 线条与标记样式

除了颜色,线条样式和标记样式也是图表中重要的视觉元素。通过调整这些样式,可以进一步增强图表的可读性和美观度。

  • 线条样式

Seaborn支持多种线条样式,包括实线、虚线、点划线等。这些样式可以通过linestyle参数进行设置。不同的线条样式可以用于区分不同的数据集或表示不同的数据特征。

python 复制代码
# 线条样式
sns.lineplot(x="total_bill", y="tip", data=tips, linestyle="--")
plt.title("Use dashed line style")
plt.show()
  • 标记样式

    标记样式用于在散点图中表示数据点。Seaborn提供了多种标记样式,如圆形、方形、三角形等。这些样式可以通过marker参数进行设置,不同的标记样式可以用于区分不同的数据集或表示不同的数据特征。

python 复制代码
# 标记样式
sns.scatterplot(x="total_bill", y="tip", data=tips, marker="s")
plt.title("Use square markers")
plt.show()

1.3 主题与样式表

Seaborn不仅提供了丰富的颜色和样式设置选项,还支持多种预定义的主题和样式表。这些主题和样式表可以快速改变图表的整体外观,使其更加符合特定的设计需求或场合。

  • 预定义的主题

Seaborn提供了几个预定义的主题,如darkgrid、whitegrid、dark、white和ticks。这些主题通过调整背景颜色、网格线等元素,可以快速改变图表的视觉风格。

python 复制代码
# 使用预定义的主题
sns.set_theme(style="darkgrid")
sns.scatterplot(x="total_bill", y="tip", data=tips)
plt.title("Use the darkgrid theme")
plt.show()
  • 自定义样式表

除了使用预定义的主题,Seaborn还允许用户自定义样式表。这可以通过rc参数来实现,用户可以设置各种绘图参数,如字体大小、线条宽度等,以满足特定的设计需求。

python 复制代码
# 自定义样式表
sns.set_theme(style="whitegrid", rc={"lines.linewidth": 2.0, "font.size": 14})
sns.scatterplot(x="total_bill", y="tip", data=tips)
plt.title("Use a custom style sheet")
plt.show()
相关推荐
跟橙姐学代码2 分钟前
Python 集合:人生中最简单的真理,只有一次
前端·python·ipython
偷心伊普西隆10 分钟前
Python Excel 通用筛选函数
python·excel·pandas
Warren9817 分钟前
Spring Boot 整合网易163邮箱发送邮件实现找回密码功能
数据库·vue.js·spring boot·redis·后端·python·spring
CodeCraft Studio29 分钟前
Excel处理控件Aspose.Cells教程:使用Python将 Excel 转换为 NumPy
python·excel·numpy·aspose·数据表格·aspose.cells·excel文档格式转换
一粒马豆37 分钟前
chromadb使用hugging face模型时利用镜像网站下载注意事项
python·embedding·chroma·词嵌入·hugging face·词向量·chromadb
zhysunny1 小时前
Day22: Python涡轮增压计划:用C扩展榨干最后一丝性能!
c语言·网络·python
小张同学zkf2 小时前
【测试】基于博客系统的测试报告
python·功能测试·压力测试·测试
麦麦大数据2 小时前
求职推荐大数据可视化平台招聘系统 Vue+Flask python爬虫 前后端分离
vue.js·爬虫·python·信息可视化·flask·推荐算法·协同过滤
海绵宝宝汉堡包2 小时前
数据分析专栏记录之 -基础数学与统计知识 2 概率论基础与python
python·数据分析·概率论
赴3353 小时前
图像边缘检测
人工智能·python·opencv·计算机视觉