【数据分析】数据结构数据内容概述

文章目录

表格结构数据特征

数据类别

数据分为结构化和非结构化数据,像企业当中常用的销售表、工资表、员工表等字段和数据体现的为结构化,而图片、视频、聊天记录等不同于销售表、工资表的数据为非结构化数据。我们在日常工作中接触最多的主要是结构化数据,这也是我们分析的重点

结构化数据

结构化数据从企业的系统读取,例如从CRM系统、ERP系统、OA系统等导入,整理成表格形式,通过Excel、WPS、Nubers进行打开进行统计分析,也可以直接用例如数据库、ETL工具、可视化工具进行读取和展示

表格结构数据层级

结构化数据我们常用Excel进行打开,像一个Excel我们称作工作薄,而一个工作薄下面可以包含若干张工作表,默认为Sheet1、Sheet2、Sheet3...命名,在每一个工作表里面有若干的表格,像我们常用的D3:G12是选择数据的区域范围,单独选择一个单元格称为D7

表格结构的数据类型

表格结构是我们日常接触最多的,主要包含:数值型、文本型、逻辑型

单元格的格式属性

每个单元格承担的不同的属性,例如销售用数值表示则为125、11这些数值属性,日期则是日期格式

在Excel中还包括显示格式,则是用不同的显示格式来展示数据,例如字体加粗、倾斜等格式

表格结构数据获取方法

从企业后台数据库系统获取

在企业中,像我们使用的OA系统、CRM系统、金蝶财务系统等等,填入了一些数据、产生的一些数据都会被记录到数据库中,在数据库中会存放着许多的存储表,用户表、品牌表、销售表等,我们的技术人员可以通过SQL语句直接跟数据库交流,获取到想要的数据,然后通过文本文件、Excel、BI可视化等进行展示

后台数据库系统获取数据流程

  • 需求中的业务描述部分应尽量准确、详细、易懂
  • 需求中的数据使用部分的描述应尽量做到条理清洗、逻辑严谨、细节描述要详细
  • 需求描述结束后需要确认数据库管理人员听懂并且理解了需求内容
  • 向数据库管理人员咨询获取数据的方案,与数据库管理人员一起逐一核对方案细节

前端操作平台获取

前端操作人员可以直接从ERP、CRM等系统直接导出数据,可以解决部分需求。如果需求比较复杂或特定,还是需要数据库管理人员协助,写SQL进行提取

从企业外部渠道获取数据

企业在某些情况下需要获取外部的数据,这些数据可能会通过各种文本进行承载,而且数据可能会比较混乱,需要我们理清楚数据,并对这些数据进行汇总

表格结构数据使用方法

单元格值的引用方法

  • 引用同一工作表内单元格值:通过"=列号+行号"定位单元格
  • 引用单元格值:通过"表名!+列号+行号"定位单元格

单元格区域值的引用方法

单元格区域:

  • a.单元格区域需要由连续的单元格构成
  • b.单元格区域需要是一个方形区域

表格结构数据查询方法

查询方法:

  • a.使用表格工具搜索功能查询
  • b.使用查询函数进行查询

函数

函数构成五部分:

  • a,"="等号的意义是告诉计算机,我从现在要使用函数进行计算了,是对计算机进行函数使用宣言
  • b,函数表达式:函数表达式由函数名以及括号两部分构成,不同函数表达式代表不同的函数功能
  • c,参数进行函数计算时参照的计算依据
  • d,操作符有特殊意义的字符
  • e,返回值使用函数进行计算的目的就是为了得到计算结果,计算结果就是返回值

用查询函数进行查找

拆解查询函数VLOOKUP:

  • a,"="告诉计算机我接下来写vlookup内容不是文本值而是函数
  • b,函数表达式"vlookup()"是完整函数表达式,作用是在制定范围内查找与条件值匹配的单元格值
  • c,参数"vlookup"函数有四个参数
  • c-1:第一个参数"E2",以"E2"单元格值作为查询条件
  • c-2:第二个参数"A:B",查找范围在"A:B"的单元格区域内进行查询,查询范围中的第一列"A"列为查询匹配列,在"A"列中找到与"E2"查询条件值相同的第一个单元格值
  • c-3:第三个参数"2",查找范围内的顺序号,在A:B两列中取第二列上的单元格值
  • c-4:第四个参数"False",查找方式,false代表精确匹配,只在查询范围内匹配与条件值"E2"单元格值"李四"完全相同的单元格值
    d,操作符",",用来分隔四个不同参数
    e,返回值"F2",单元格中"8000",找到的"李四"的工资值

表格结构数据的计算方法-直接计算

直接计算:使用运算符连接单元格或单元格区域进行计算

表格结构数据的计算方法-函数计算

函数计算:使用函数对单元格及单元格区域值进行并返回计算结果

相关推荐
可观测性用观测云35 分钟前
Cloudflare 日志采集和分析最佳实践
数据分析
真智AI2 小时前
AI智能体时代来临:数据分析的变革与自动化之路
人工智能·数据分析·自动化
程序员阿超的博客3 小时前
Python 数据分析与机器学习入门 (五):Matplotlib 数据可视化基础
python·信息可视化·数据分析·matplotlib·数据可视化·python教程·pyplot
顾道长生'3 小时前
(Arxiv-2024)自回归模型优于扩散:Llama用于可扩展的图像生成
计算机视觉·数据挖掘·llama·自回归模型·多模态生成与理解
蓝婷儿9 小时前
Python 数据分析与可视化 Day 14 - 建模复盘 + 多模型评估对比(逻辑回归 vs 决策树)
python·数据分析·逻辑回归
好开心啊没烦恼10 小时前
Python:线性代数,向量内积谐音记忆。
开发语言·python·线性代数·数据挖掘·数据分析
过期的秋刀鱼!10 小时前
用“做饭”理解数据分析流程(Excel三件套实战)
数据挖掘·数据分析·excel·powerbi·数据分析入门
小庞在加油10 小时前
《dlib库中的聚类》算法详解:从原理到实践
c++·算法·机器学习·数据挖掘·聚类
kngines11 小时前
【字节跳动】数据挖掘面试题0001:打车场景下POI与ODR空间关联查询
人工智能·数据挖掘·面试题
大数据CLUB13 小时前
基于spark的航班价格分析预测及可视化
大数据·hadoop·分布式·数据分析·spark·数据可视化