Orange3数据可视化(箱线图-离散属性分布)

箱线图(Box Plot)

又称为盒须图、盒式图、盒状图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因图形如箱子,且在上下四分位数之外常有线条像胡须延伸出去而得名

箱线图可以显示属性值的分布,快速发现异常,例如重复的值,离群值等,挖掘数据的分布规律

输入

数据:输入数据集

输出

选中的数据:从图中选中的实例

数据:带有额外一列,显示点是否被选中

箱形图小部件显示属性值的分布。使用此小部件检查任何新数据是一个好习惯,

可以快速发现任何异常,例如重复值(例如,灰色和灰色的值)、异常值等。

箱型图的特征

1.直观地观察到异常值,如果数据存在离群点,即位于上下边缘区域之外,以圆点的形式表示

2.当箱型图很短时,意味着很多数据多集中分布在很小的范围内

3.当箱型图很长时,意味着数据分布比较离散,数据间的差异比较大

4.当中位数接近底部时,说明大部分的数据值比较小

5.当中位数接近顶部时,说明大部分的数据值比较大

6.中位数所处的高低位置能反映数据的偏斜程度

7.如果上下虚线比较长,说明上下四分位数之外的数据变化比较大,整体数据的方差和标准偏差也比较大

8.箱型图的上下边缘并非最大值或最小值

箱型图的缺点

1.箱型图虽然能显示出数据的分布偏态,但是不能提供关于数据分布偏态和尾重程度的精确度量;

2.对于批量较大的数据批,箱线图反映的形状信息更加模糊;

3.用中位数代表总体平均水平有一定的局限性。

所以,应用箱线图最好结合其它描述统计工具如均值、标准差、偏度、分布函数等来描述数据批的分布形状。

详细说明

  • 选择要绘制的变量。勾选"按与子组的相关性排序"以根据所选子组的Chi2或ANOVA对变量进行排序。

  • 选择"子组"以查看由离散子组显示的箱线图。勾选"按与变量的相关性排序"以根据所选变量的Chi2或ANOVA对子组进行排序。

  • 当实例按子组分组时,您可以更改显示模式。带注释的框将显示端值、平均值和中位数,而比较中位数和比较平均值将自然而然地在子组之间比较所选值。

  • 平均值(深蓝色垂直线)。细蓝色线代表标准差。

  • 第一个(25%)和第三个(75%)四分位数的值。蓝色高亮区域表示第一个和第三个四分位数之间的值。

  • 中位数(黄色垂直线)。

对于离散属性,条形图代表每个特定属性值的实例数量。该图显示了动物园数据集中不同动物类型的数量:有41种哺乳动物,13种鱼,20种鸟类等。

显示选项:

  • 拉伸条形:显示数据实例的相对值(比例)。未勾选的框显示绝对值。
  • 显示框标签:在每个条形图上方显示离散值。
  • 按子组频率排序:按降序对子组进行排序。

示例

软件下载链接: https://pan.baidu.com/s/12drK7Mz7YSqrwIQk5Wh5cw?pwd=8tnd

视频教程:关注我不迷路, 抖音:Orange3dev


https://www.douyin.com/user/MS4wLjABAAAAicBGZTE2kX2EVHJPe8Ugk3_nlJk9Nha8OZh4Bo_nTu8

1-组件概览

2-树查看器-决策树

3-箱线图-离散属性分布

4-箱线图-要素计算

5-箱线图-连续属性分布

6-小提琴图

7-分布图

8-散点图-智能数据可视化

9-散点图-探索性数据分析

10-散点图-高亮选择数据

11-折线图

12-条形图

13-筛网图

14-马赛克图

15-自由投影

16-线性投影

17-雷达图

18-热力图

19-韦恩图

20-轮廓图

21-毕达哥拉斯树

22-毕达哥拉斯森林

23-CN2规则查看器

24-诺莫图

相关推荐
搞科研的小刘选手4 小时前
【多所高校主办】第七届机器人、智能控制与人工智能国际学术会议(RICAI 2025)
人工智能·机器学习·ai·机器人·无人机·传感器·智能控制
西***63475 小时前
怕故障?怕扩展难?分布式可视化控制:给足场景安全感
分布式·数据可视化
老师可可5 小时前
成绩发布工具使用方法,附成绩分析教程
学习·信息可视化·小程序·excel·学习方法
Dev7z6 小时前
肝脏肿瘤MRI图像分类数据集
人工智能·分类·数据挖掘
hoiii1877 小时前
基于SVM与HOG特征的交通标志检测与识别
算法·机器学习·支持向量机
进击的炸酱面7 小时前
第四章 决策树
算法·决策树·机器学习
电鱼智能的电小鱼7 小时前
基于电鱼 ARM 工控机的井下设备运行状态监测方案——实时采集电机、电泵、皮带机等关键设备运行数据
arm开发·人工智能·嵌入式硬件·深度学习·机器学习·制造
xiao5kou4chang6kai47 小时前
如何通过机器学习(如K-means、SVM、决策树)与深度学习(如CNN、LSTM)模型,进行全球气候变化驱动因素的数据分析与趋势预测
深度学习·机器学习·kmeans·生态环境监测·全球气候变化
大千AI助手7 小时前
Householder变换:线性代数中的镜像反射器
人工智能·线性代数·算法·决策树·机器学习·qr分解·householder算法
长颈鹿仙女7 小时前
数学基础-线性代数(向量、矩阵、运算、范数、特征向量、特征值)
线性代数·机器学习·矩阵