数据分析可视化:散点图矩阵与雷达图的生成

目录

一、经营数据绘制散点图矩阵

java 复制代码
import seaborn as sns
import pandas as pd
rc = {'font.sans-serif':'Arial Unicode MS',
     'axes.unicode_minus':False}
sns.set(context='notebook',style='ticks',rc=rc)
iris = pd.read_excel("D:/edge/经营数据.xls")
sns.pairplot(iris,hue='type',plot_kws={'alpha':0.6,'s':80,'edgecolor':'k'},height=3)

下面是对代码的解释和一些可能需要注意的地方:

1.代码解释

python 复制代码
import seaborn as sns
import pandas as pd

# 设置绘图的字体和符号显示
rc = {'font.sans-serif': 'Arial Unicode MS', 'axes.unicode_minus': False}
sns.set(context='notebook', style='ticks', rc=rc)

# 读取Excel文件中的数据
iris = pd.read_excel("D:/edge/经营数据.xls")

# 使用pairplot绘制散点图矩阵
sns.pairplot(iris, hue='type', plot_kws={'alpha': 0.6, 's': 80, 'edgecolor': 'k'}, height=3)

# 显示图形
import matplotlib.pyplot as plt
plt.show()

2.代码说明

  1. 导入必要的库

    • seaborn 用于绘制统计图形。
    • pandas 用于数据处理和读取。
  2. 设置绘图样式

    • rc 字典用于设置绘图的字体和符号显示。'font.sans-serif': 'Arial Unicode MS' 设置了默认的无衬线字体,适用于中文显示。'axes.unicode_minus': False 避免负号显示为方块。
  3. 读取数据

    • 使用 pd.read_excel 从Excel文件中读取数据。确保文件路径正确,且文件存在。
  4. 绘制散点图矩阵

    • sns.pairplot 用于绘制散点图矩阵。
    • hue='type' 指定了分类变量,根据不同的类型使用不同的颜色。
    • plot_kws 字典用于设置散点图的样式,包括透明度 (alpha)、点的大小 (s) 和边缘颜色 (edgecolor)。
    • height=3 设置每个子图的高度为3英寸。
  5. 显示图形

    • 使用 plt.show() 显示绘制的图形。

3.注意事项

  1. 文件路径 :确保文件路径 D:/edge/经营数据.xls 正确且文件存在。如果文件不在指定位置,代码会报错。

  2. 数据格式 :确保Excel文件中的数据格式正确,特别是分类变量 type 列是否存在且数据类型正确。

  3. 字体安装 :确保系统中已安装 Arial Unicode MS 字体,否则可能会导致中文显示问题。如果没有安装,可以考虑使用其他支持中文的字体。

  4. 环境配置 :确保你的Python环境中已安装 seabornpandasmatplotlib 库。可以使用以下命令安装这些库:

    bash 复制代码
    pip install seaborn pandas matplotlib

二、雷达图

1.代码解释

python 复制代码
import pygal

# 创建配置对象
my_config = pygal.Config()
my_config.show_legend = True

# 设置图表样式
my_config.style.title_font_size = 26
my_config.style.label_font_size = 16

# 创建雷达图对象
radar_chart = pygal.Radar(my_config, fill=False, range=(0, 50))

# 设置图表标题
radar_chart.title = '雷达图'

# 设置 X 轴标签
radar_chart.x_labels = ['东', '西', '中', '华南', '西南', '西北', '东北']

# 添加数据系列
radar_chart.add('第一', [22, 11, 33, 44, 23, 23, 34])
radar_chart.add('第二', [20, 15, 33, 42, 43, 43, 34])
radar_chart.add('第三', [22, 31, 23, 34, 53, 43, 34])

# 将图表渲染为 SVG 文件
radar_chart.render_to_file('雷达图.svg')

2.代码说明

  1. 导入 pygal

    • pygal 是一个用于生成矢量图形(SVG)的 Python 库。
  2. 创建配置对象

    • my_config = pygal.Config() 创建了一个配置对象,用于设置图表的各种属性。
    • my_config.show_legend = True 启用了图例显示。
  3. 设置图表样式

    • my_config.style.title_font_size = 26 设置了图表标题的字体大小。
    • my_config.style.label_font_size = 16 设置了标签的字体大小。
  4. 创建雷达图对象

    • radar_chart = pygal.Radar(my_config, fill=False, range=(0, 50)) 创建了一个雷达图对象,并设置了配置对象、是否填充区域以及数据范围。
  5. 设置图表标题

    • radar_chart.title = 'bushuo' 设置了图表的标题。
  6. 设置 X 轴标签

    • radar_chart.x_labels = ['东', '西', '中', '华南', '西南', '西北', '东北'] 设置了 X 轴的标签。
  7. 添加数据系列

    • radar_chart.add('第一', [22, 11, 33, 44, 23, 23, 34]) 添加了第一个数据系列。
    • radar_chart.add('第二', [20, 15, 33, 42, 43, 43, 34]) 添加了第二个数据系列。
    • radar_chart.add('第三', [22, 31, 23, 34, 53, 43, 34]) 添加了第三个数据系列。
  8. 将图表渲染为 SVG 文件

    • radar_chart.render_to_file('雷达图.svg') 将图表保存为名为 雷达图.svg 的 SVG 文件。

3. 注意事项

  1. 安装 pygal

    • 确保你的环境中已安装 pygal 库。如果没有安装,可以使用以下命令安装:

      bash 复制代码
      pip install pygal
  2. 字体显示

    • 如果你在图表中使用中文标签,确保你的系统支持中文显示。如果中文显示有问题,可以考虑使用其他支持中文的字体。
  3. 文件路径

    • 确保你有权限在当前目录下创建和写入文件。如果需要,可以指定完整的文件路径。

4. 运行代码

将上述代码保存到一个 Python 文件中,然后运行该文件,你应该能够在当前目录下看到一个名为 雷达图.svg 的文件,打开该文件即可查看生成的雷达图。

指定文件保存路径

你可以在 render_to_file 方法中指定文件的完整路径,这样可以直接将文件保存到你希望的位置。

java 复制代码
radar_chart.render_to_file('D:/charts/雷达图.svg')

总结

通过上述代码,可以生成一个散点图矩阵和一个雷达图,分别用于展示经营数据的不同方面。这些图表不仅可以帮助你更好地理解数据,还可以用于报告和展示,提高数据分析的可视化效果。确保在运行代码前检查文件路径和数据格式,以避免潜在的错误。

相关推荐
SelectDB技术团队18 小时前
Apache Doris 2025 Roadmap:构建 GenAI 时代实时高效统一的数据底座
大数据·数据库·数据仓库·人工智能·ai·数据分析·湖仓一体
Loving_enjoy20 小时前
基于Hadoop的明星社交媒体影响力数据挖掘平台:设计与实现
大数据·hadoop·数据挖掘
程序员Linc21 小时前
写给新人的深度学习扫盲贴:向量与矩阵
人工智能·深度学习·矩阵·向量
千鼎数字孪生-可视化1 天前
3D模型给可视化大屏带来了哪些创新,都涉及到哪些技术栈。
ui·3d·信息可视化·数据分析
Python之栈1 天前
PandasAI:当数据分析遇上自然语言处理
人工智能·python·数据分析·pandas
Start_Present1 天前
Pytorch 第十二回:循环神经网络——LSTM模型
pytorch·rnn·神经网络·数据分析·lstm
DREAM.ZL1 天前
基于python的电影数据分析及可视化系统
开发语言·python·数据分析
代码骑士1 天前
聚类(Clustering)基础知识2
机器学习·数据挖掘·聚类
大美B端工场-B端系统美颜师1 天前
静态图表 VS 动态可视化,哪种更适合数据故事讲述?
信息可视化·数据挖掘·数据分析
青云交2 天前
Java 大视界 -- Java 大数据在智能电网电力市场交易数据分析与策略制定中的关键作用(162)
java·大数据·数据分析·交易策略·智能电网·java 大数据·电力市场交易