数据挖掘神器Orange初步使用

文章目录

安装

可以在官网下载,地址为Orange,如果已经装了Anaconda,则可在Anaconda Navigator中找到一个非常猥琐的图标,下面写着Orange3,可以点击Install,装完之后点Launch就能用了。

当然也可以用命令行

复制代码
conda config --add channels conda-forge
conda install orange3

安装完成后,可在命令行启动程序

复制代码
orange-canvas
# 或者
python -m Orange.canvas

也可以直接找到orange-canvas.exe,其路径在Orange/Scripts中。

示例项目

打开之后,选择help->Example Workflows,打开示例项目,这里选择Classification Tree,即分类树,打开之后如下图所示,其中文本框可以编辑,下图就是将原文小小地翻译了一下。

在Orange的画板上,最小单元为组件,双击那些圆形的组件,可以查看其属性。点击左侧的Data Table,添加一个新的组件,并点击其左侧的虚线,拉出线条与File相连接,就会把数据"导入"到表格中,双击就可以查看了。

展示鸢尾花数据

将File图标拖入右侧画布,双击弹出窗口,选择iris.tab文件,关闭。

将Data Table拖入画布,点击File外侧的虚线并拖动,使二者连接,然后双击数据表,就可以查看iris.tab的内容了。

右侧为数据表格,左侧可对数据表格的一些特性进行定制,比如勾选Visulize numeric values后,表格中会用蓝色的横线表示某个单元格中的值在整个列中的相对大小。

用同样的方式,将Paint Data也拖入画布,并与File连接,然后双击,就可以看到对数据的可视化展示,效果如下

右侧就是绘图窗口,而左侧相当于是控制台。首先Labels有三类不同颜色,正好对应上表中iris那一栏的三种类别。下面Tools中有六个工具,可分为四类

  • Brush和Put用于增加数据,前者像刷子一样,一下新增多组数据,后者则一次新增一个。以上图为例,由于选中了蓝色的类别,所以使用这两个工具会在鼠标所在位置,新增setosa点。
  • Jitter和Magnet:用于调整数据在图中的位置,Jitter可以让数据点远离鼠标;Magnet则可以让数据点靠近鼠标。
  • Select:用于框选
  • Clear:清除样本

在使用上述工具后,会改变原有的数据排布,此时可点击Reset to Input Data,以重置数据。

接下来,将Feature Statistics拖动到画布中,双击点开即可看到三类鸢尾花的分布情况。

相关推荐
梦幻精灵_cq1 天前
Linux.date格式化标识“制作”极简台历 vs Python.datetime.strftime格式化“精美”日历牌(时间工具依情境选择也是一种“智慧)
linux·python
新元代码1 天前
Function Calling的现状和未来的发展
人工智能
jinxinyuuuus1 天前
订阅指挥中心:数据可移植性、Schema设计与用户数据主权
数据仓库·人工智能
ASS-ASH1 天前
视觉语言大模型Qwen3-VL-8B-Instruct概述
人工智能·python·llm·多模态·qwen·视觉语言模型·vlm
Xy-unu1 天前
[LLM]AIM: Adaptive Inference of Multi-Modal LLMs via Token Merging and Pruning
论文阅读·人工智能·算法·机器学习·transformer·论文笔记·剪枝
kangk121 天前
统计学基础之概率(生物信息方向)
人工智能·算法·机器学习
再__努力1点1 天前
【77】积分图像:快速计算矩形区域和核心逻辑
开发语言·图像处理·人工智能·python·算法·计算机视觉
matlabgoodboy1 天前
程序代做python代编程matlab代码设计plc深度学习java编写C++代写
python·深度学习·matlab
福客AI智能客服1 天前
露营装备行业智能 AI 客服:从 “售后救火” 到 “售前场景赋能” 的转型路径
人工智能
ccLianLian1 天前
DINO系列
人工智能·计算机视觉