Python数据可视化-Pandas绘图

文章目录

  • [一. Pandas数据可视化简介](#一. Pandas数据可视化简介)
  • [二. Pandas 单变量可视化](#二. Pandas 单变量可视化)
    • [1. 柱状图](#1. 柱状图)
    • [2. 折线图](#2. 折线图)
    • [3. 面积图](#3. 面积图)
  • [三. Pandas 双变量可视化](#三. Pandas 双变量可视化)

一. Pandas数据可视化简介

pandas库是Python数据分析的核心库

它不仅可以加载和转换数据,还可以做更多的事情:它还可以可视化

pandas绘图API简单易用,是pandas流行的重要原因之一

二. Pandas 单变量可视化

  • 单变量可视化, 包括条形图、折线图、直方图、饼图等
  • 数据使用葡萄酒评论数据集,来自葡萄酒爱好者杂志,包含10个字段,150929行,每一行代表一款葡萄酒
  • 加载数据
python 复制代码
import pandas as pd
reviews = pd.read_csv('data/winemag-data_first150k.csv',index_col=0)
reviews.head()

1. 柱状图

条形图是最简单最常用的可视化图表

在下面的案例中,将所有的葡萄酒品牌按照产区分类,看看哪个产区的葡萄酒品种多:

python 复制代码
kwargs = dict(figsize=(16, 8),fontsize=20,color = ['r', 'g', 'b', 'y', 'm'])
reviews['province'] .value_counts().head().plot.bar(**kwargs)

上面的图表说明加利福尼亚生产的葡萄酒比其他省都多

也可以折算成比例, 观察加利福尼亚葡萄酒占总数的百分比

python 复制代码
(reviews['province'] .value_counts().head()/len(reviews)).plot.bar(**kwargs)

在《葡萄酒杂志》(Wine Magazine)评述的葡萄酒中,加利福尼亚生产了近三分之一!

条形图(柱状图)非常灵活:

  • 高度可以代表任何东西,只要它是数字即可
  • 每个条形可以代表任何东西,只要它是一个类别即可。

也可以用来展示《葡萄酒杂志》(Wine Magazine)给出的评分数量的分布情况:

python 复制代码
reviews['points'] .value_counts().sort_index().plot.bar(**kwargs)

2. 折线图

如果要绘制的数据不是类别值,而是连续值比较适合使用折线图

python 复制代码
reviews['points'] .value_counts().sort_index().plot.line(**kwargs)

柱状图和折线图区别

柱状图:

  • 简单直观,很容易根据柱子的长短看出值的大小,易于比较各组数据之间的差别

折线图:

  • 易于比较各组数据之间的差别
  • 能比较多组数据在同一个维度上的趋势
  • 每张图上不适合展示太多折线

3. 面积图

面积图就是在折线图的基础上,把折线下面的面积填充颜色

python 复制代码
reviews['points'] .value_counts().sort_index().plot.area(**kwargs)

当只有一个变量需要制图时,面积图和折线图之间差异不大,在这种情况下,折线图和面积图可以互相替换

三. Pandas 双变量可视化

相关推荐
多恩Stone1 小时前
【3DV 进阶-2】Hunyuan3D2.1 训练代码详细理解下-数据读取流程
人工智能·python·算法·3d·aigc
xiaopengbc1 小时前
在 Python 中实现观察者模式的具体步骤是什么?
开发语言·python·观察者模式
Python大数据分析@1 小时前
python用selenium怎么规避检测?
开发语言·python·selenium·网络爬虫
ThreeAu.1 小时前
Miniconda3搭建Selenium的python虚拟环境全攻略
开发语言·python·selenium·minicoda·python环境配置
偷心伊普西隆1 小时前
Python EXCEL 理论探究:格式转换时处理缺失值方法
python·excel
精灵vector2 小时前
LLMCompiler:基于LangGraph的并行化Agent架构高效实现
人工智能·python·langchain
java1234_小锋2 小时前
Scikit-learn Python机器学习 - 特征降维 压缩数据 - 特征选择 - 移除低方差特征(VarianceThreshold)
python·机器学习·scikit-learn
万邦科技Lafite3 小时前
实战演练:通过API获取商品详情并展示
大数据·数据库·python·开放api接口