【愚公系列】《数据可视化分析与实践》018-数据集(单表数据集)

💎【行业认证·权威头衔】

✔ 华为云天团核心成员:特约编辑/云享专家/开发者专家/产品云测专家

✔ 开发者社区全满贯:CSDN博客&商业化双料专家/阿里云签约作者/腾讯云内容共创官/掘金&亚马逊&51CTO顶级博主

✔ 技术生态共建先锋:横跨鸿蒙、云计算、AI等前沿领域的技术布道者

🏆【荣誉殿堂】

🎖 连续三年蝉联"华为云十佳博主"(2022-2024)

🎖 双冠加冕CSDN"年度博客之星TOP2"(2022&2023)

🎖 十余个技术社区年度杰出贡献奖得主

📚【知识宝库】

覆盖全栈技术矩阵:

◾ 编程语言:.NET/Java/Python/Go/Node...

◾ 移动生态:HarmonyOS/iOS/Android/小程序

◾ 前沿领域:物联网/网络安全/大数据/AI/元宇宙

◾ 游戏开发:Unity3D引擎深度解析

文章目录


🚀前言

前面对数据分析过程中数据来源的问题进行了详尽的探讨。本文将深入分析数据集的功能,介绍单表数据集、多表关联数据集和自定义SQL数据集的构建方法,并阐述数据集管理和定时同步数据的策略,为后续的数据分析或报表制作进行必要的数据准备。读者能够通过关联和处理表格中的数据,自由地组合并形成个性化的数据集合,以满足后续业务分析和图表制作的需求。

在DataEase中,数据集是核心的功能模块,为接下来的数据分析或报表制作进行必要的数据准备。DataEase中有3种数据集:单表数据集、自定义SQL数据集和多表关联数据集。这3种数据集各自适用于不同的使用场景。

在讲解3种数据集之前,先对DataEase中多元化的数据源进行概括性的分类,主要包括:数据库(涵盖OLTP、OLAP型数据库及数据湖)、API数据和本地文件。数据库中的数据是以表的形式存储的;API数据源通过接口获取数据后,数据在DataEase中也会被转化为数据表的形式并存储;同理,本地文件(如Excel文件)的每一个sheet页也会被转换成一张数据表。尽管这些表的命名规则可能略有不同,例如,API数据表以"api_"为前缀,Excel文件则以"excel"为前缀,数据库数据表则维持表原来的名字,但DataEase中最终的存储单位都是数据表。

因此,无论数据源的类型如何,一旦与DataEase连接,其数据最终都将以表的形式进行存储和展示。

🚀一、单表数据集

在DataEase中,数据集 是连接原始数据源与最终可视化图表之间的关键枢纽。它是经过选择、加工和组织后的数据集合,是制作图表和分析的直接数据基础。数据集可以分为多种类型,其中单表数据集 是最基础、最常用的一种。顾名思义,单表数据集直接来源于一个数据源中的单张数据表(例如Excel文件中的一个工作表、MySQL数据库中的一个表、或一个API接口返回的数据),不涉及多表关联或复杂的SQL查询。创建单表数据集是将原始数据"准备就绪"供分析使用的第一步。

本节将以已创建的本地文件(Excel)数据源------"零食数据" 为例,完整演示如何基于此数据源创建一个名为"Excel-零食数据"的单表数据集。

🔎1.创建单表数据集的详细步骤

🦋步骤一:进入数据集管理模块

  1. 登录DataEase系统后,在主界面左侧导航栏中找到并单击 【数据准备】 模块。
  2. 在弹出的子菜单中,单击 【数据集】,系统将跳转至数据集管理界面(见图7-1)。这里列出了所有已创建的数据集。

图7-1 数据集管理列表界面

🦋步骤二:开始创建并选择数据源

  1. 在数据集管理界面,点击右上角的 【新建数据集】 按钮(或页面中的"+"图标)。
  2. 系统将进入数据集创建与编辑页面。首先,在页面左侧的 数据源选择区 ,找到并单击之前创建的 "零食数据" 数据源(它是一个Excel类型的数据源)。选择后,该数据源下包含的数据表(通常为Excel文件的工作表)会显示出来(见图7-2)。

图7-2 选择数据源并拖拽数据表至编辑区

🦋步骤三:拖拽数据表并预览

  1. 将左侧显示的数据表 (例如名为 Sheet1 或具体表名)用鼠标拖拽 到右侧的数据集编辑区。这表示您选择了这张表作为数据集的基础。
  2. 数据表被放入编辑区后,为了确认数据内容和结构是否正确,点击编辑区上方的 【刷新数据】 按钮。系统会从数据源中读取最新数据,并在下方展示数据预览表格(见图7-2)。请仔细核对字段和样例数据。

🦋步骤四:保存数据集

  1. 确认数据预览无误后,点击页面右上角的 【保存并返回】 按钮(见图7-3)。
  2. 系统会弹出"保存数据集"对话框(见图7-3)。在此对话框中:
    • 输入数据集名称 :填写一个具有业务意义的名称,如 "Excel-零食数据"
    • 选择所属文件夹:可以将数据集归类到某个文件夹中,便于后续管理(可选)。
  3. 填写完毕后,点击 【确认】 按钮,完成数据集的保存。

图7-3 保存数据集对话框

🦋步骤五:查看与预览数据集

  1. 保存成功后,页面会自动跳转到该数据集的数据预览页面 (见图7-4)。在这里,您可以:
    • 再次完整地浏览数据集中的所有数据。
    • 查看各字段的名称和数据类型。
    • 进行简单的排序和搜索。
    • 确认这就是后续制作图表时需要使用的数据。

图7-4 "Excel-零食数据"数据集预览界面

🔎2.单表数据集的通用性

单表数据集的创建流程具有高度的通用性。如图7-5所示,当您在数据集编辑器的左侧选择不同类型的数据源时,操作逻辑完全一致:

  • Excel数据源:显示上传的Excel文件中的工作表列表。
  • API数据源:显示在该数据源下配置的各个API接口(每个接口视为一张表)。
  • MySQL等数据库数据源:显示该数据库中的所有数据表。

图7-5 不同类型数据源在数据集创建界面的展示

操作的本质都是:选择数据源 → 拖拽目标表至编辑区 → 预览并保存。 这意味着,无论您的数据来自哪里,只要成功创建了数据源,将其转换为可供分析的单表数据集的过程都是简单、统一且直观的。

总结

通过以上步骤,您已经成功地将一个本地Excel文件中的数据,通过"数据源"→"数据集"的流程,转化为了DataEase中一个标准的、可重复使用的分析对象------"Excel-零食数据"数据集。这个数据集现在可以被任何有权限的用户在创建图表时直接调用,进行各种可视化分析和探索。掌握单表数据集的创建,是使用DataEase进行自助数据分析的基石。在后续章节中,我们将基于此数据集,学习如何制作具体的可视化图表。

相关推荐
2501_921930839 小时前
进阶实战 Flutter for OpenHarmony:自定义仪表盘系统 - 高级数据可视化实现
flutter·信息可视化
愚公搬代码11 小时前
【愚公系列】《数据可视化分析与实践》019-数据集(自定义SQL数据集)
数据库·sql·信息可视化
babe小鑫13 小时前
大专数据可视化技术专业学习数据分析的价值
学习·信息可视化·数据分析
YangYang9YangYan1 天前
2026高职计算机专业学数据分析的实用性分析
信息可视化
Highcharts.js1 天前
Highcharts旭日图(Sunburst)完全指南:从树形数据结构到多层圆环可视化
信息可视化·数据挖掘·数据分析
开发者导航1 天前
【开发者导航】多功能生成模型开发工具:Diffusers 详细介绍
人工智能·python·学习·macos·信息可视化
愚公搬代码2 天前
【愚公系列】《数据可视化分析与实践》014-数据源(数据源介绍)
信息可视化
愚公搬代码2 天前
【愚公系列】《数据可视化分析与实践》015-数据源(本地文件Excel)
信息可视化·excel
励ℳ2 天前
【生信绘图】基因组大小与CDS数量关系的可视化
python·信息可视化