数据分析:密度图

目前拥有的数据如图,三列分别对应瑕疵种类,对应的置信

度,x方向坐标。

现在想要做的事是观看瑕疵种类和置信度之间的关系。
要显示数据分布的集中程度,可以使用以下几种常见的图形来观察:

1、箱线图(Box Plot):箱线图展示了数据的中位数、上下四分位数、最小值和最大值等统计指标,并通过箱体的长度和须的长度来表示数据的分布情况。箱线图能够展示数据的异常值和偏态程度,从而提供数据集中程度的信息。

2、直方图(Histogram):直方图用柱状图的形式表示数据在不同区间内的频数或频率。直方图能够给出数据的分布情况,高度表示数据出现的频次,整个图形可以展示数据的集中和离散程度。

3、密度图(Density Plot):密度图是通过平滑直方图来估计数据的概率密度函数,并以连续曲线的形式展示数据分布的集中程度。密度图可以更直观地看出数据的峰值和分布的波动情况。

4、散点图(Scatter Plot):散点图用点的位置来表示两个变量之间的关系。通过观察散点图中点的分布情况,可以大致判断数据的集中程度和相关性。

下面我使用的是密度图,因为密度的连续曲线更加容易看出数据分布的集中程度。

c 复制代码
import pandas as pd
import matplotlib.pyplot as plt

# 读取没有列标签的CSV文件
df = pd.read_csv('camera0.csv', header=None)
# 使用整数索引访问列数据
confidence_by_type = df.groupby(0)[1]
# 绘制置信度密度分布图
plt.figure(figsize=(10, 6))
confidence_by_type.plot(kind='density', linewidth=2, alpha=0.5)
plt.xlabel('Confidence')
plt.ylabel('Density')
plt.title('Confidence Density Distribution by Type')
plt.legend(confidence_by_type.groups.keys())

# 显示图形
plt.show()

如上图所示,我的横坐标是第二列置信度,纵坐标是密度,四条线分别对应第一列的四种类型。

这样就可以看懂我的数据的分布集中情况。

相关推荐
B站_计算机毕业设计之家40 分钟前
深度学习:Yolo水果检测识别系统 深度学习算法 pyqt界面 训练集测试集 深度学习 数据库 大数据 (建议收藏)✅
数据库·人工智能·python·深度学习·算法·yolo·pyqt
闲人编程1 小时前
用Python分析你的Spotify/网易云音乐听歌数据
开发语言·python·ai·数据分析·spotify·网易云·codecapsule
“负拾捌”1 小时前
LangChain 中 ChatPromptTemplate 的几种使用方式
python·langchain·prompt
咋吃都不胖lyh2 小时前
小白零基础教程:安装 Conda + VSCode 配置 Python 开发环境
人工智能·python·conda
阿里云大数据AI技术2 小时前
EMR StarRocks Stella内核正式发布,登顶TPC榜单全球第一
数据分析
闲人编程3 小时前
构建一个短链接生成器服务(FastAPI + SQLite)
jvm·python·sqlite·fastapi·生成器·短链接·caodecapsule
大数据CLUB3 小时前
酒店预订数据分析及预测可视化
大数据·hadoop·分布式·数据挖掘·数据分析·spark·mapreduce
杰瑞哥哥3 小时前
标准 Python 项目结构
开发语言·python
西部森林牧歌4 小时前
Arbess零基础学习 - 使用Arbess+GitLab实现Python项目构建/主机部署
python·ci/cd·gitlab·tiklab devops