选项 "Remove redundant instance" 是在转置时进行数据去重的选项。当勾选此选项时,如果在原始数据中存在多个相同的记录(即每个特征列中的数据完全一样),则在转置操作中只保留其中唯一的一个记录,并从转置后的数据中删除其余记录。
这个选项可以在一定程度上优化数据的质量和性能。因为如果原始数据中存在重复的记录,在转置操作中这些重复的记录会被转置为多个完全相同的特征列,而这些列中的数据都是完全相同的。这样会导致转置后的数据出现冗余信息,从而使得数据更难以理解和操作,甚至引起后续分析模型的异常。
因此,勾选 "Remove redundant instance" 可以有效地去除数据中的冗余信息,使得数据更加干净、简洁和易于理解。
视频教程:https://www.douyin.com/user/MS4wLjABAAAAicBGZTE2kX2EVHJPe8Ugk3_nlJk9Nha8OZh4Bo_nTu8
1-Orange3安装
2-Orange3汉化DIY
3-Orange3创建快方式
4-数据导入(文件&数据表格组件)
5-数据导入(Python组件)
6-Python库安装(SQL表组件)
7-数据导入(Mysql)
8-数据导入(数据绘画和公式组件)
9-数据修改(域编辑和保存组件)
10-数据可视化(调色板&数据信息组件)
11-数据可视化(特征统计组件)
12-数据预处理(行选择组件)
13-特征选择(Rank组件)
14-数据转换(数据采样组件)
15-数据预处理(列选择组件)
16-数据预处理(转置组件)
17-数据预处理(合并数据组件)
18-数据预处理(连接组件)无主表且列数不同
19-数据预处理(连接组件)主附表
20-数据预处理(索引选择器组件)
21-数据预处理(唯一组件)
22-数据预处理(列聚合组件)
23-数据预处理(分组组件)
24-数据预处理(透视图表组件)
25-数据预处理(转换器组件)-表格互为模板
26-数据预处理(转换器组件)-转换示例
27-数据预处理(预处理器组件)-基本信息
28-数据预处理(预处理器组件)-特征选择
29-数据预处理(预处理器组件)-填充缺失值并标准化特征
30-数据预处理(预处理器组件)-离散化连续变量
31-数据预处理(预处理器组件)-连续化离散变量
32-数据预处理(预处理器组件)-主成分分析PCA与CUR分解
33-数据预处理(缺失值处理组件)
34-数据预处理(连续化组件)
35-数据预处理(离散化组件)