【数据分析】数据结构数据内容概述

文章目录

表格结构数据特征

数据类别

数据分为结构化和非结构化数据,像企业当中常用的销售表、工资表、员工表等字段和数据体现的为结构化,而图片、视频、聊天记录等不同于销售表、工资表的数据为非结构化数据。我们在日常工作中接触最多的主要是结构化数据,这也是我们分析的重点

结构化数据

结构化数据从企业的系统读取,例如从CRM系统、ERP系统、OA系统等导入,整理成表格形式,通过Excel、WPS、Nubers进行打开进行统计分析,也可以直接用例如数据库、ETL工具、可视化工具进行读取和展示

表格结构数据层级

结构化数据我们常用Excel进行打开,像一个Excel我们称作工作薄,而一个工作薄下面可以包含若干张工作表,默认为Sheet1、Sheet2、Sheet3...命名,在每一个工作表里面有若干的表格,像我们常用的D3:G12是选择数据的区域范围,单独选择一个单元格称为D7

表格结构的数据类型

表格结构是我们日常接触最多的,主要包含:数值型、文本型、逻辑型

单元格的格式属性

每个单元格承担的不同的属性,例如销售用数值表示则为125、11这些数值属性,日期则是日期格式

在Excel中还包括显示格式,则是用不同的显示格式来展示数据,例如字体加粗、倾斜等格式

表格结构数据获取方法

从企业后台数据库系统获取

在企业中,像我们使用的OA系统、CRM系统、金蝶财务系统等等,填入了一些数据、产生的一些数据都会被记录到数据库中,在数据库中会存放着许多的存储表,用户表、品牌表、销售表等,我们的技术人员可以通过SQL语句直接跟数据库交流,获取到想要的数据,然后通过文本文件、Excel、BI可视化等进行展示

后台数据库系统获取数据流程

  • 需求中的业务描述部分应尽量准确、详细、易懂
  • 需求中的数据使用部分的描述应尽量做到条理清洗、逻辑严谨、细节描述要详细
  • 需求描述结束后需要确认数据库管理人员听懂并且理解了需求内容
  • 向数据库管理人员咨询获取数据的方案,与数据库管理人员一起逐一核对方案细节

前端操作平台获取

前端操作人员可以直接从ERP、CRM等系统直接导出数据,可以解决部分需求。如果需求比较复杂或特定,还是需要数据库管理人员协助,写SQL进行提取

从企业外部渠道获取数据

企业在某些情况下需要获取外部的数据,这些数据可能会通过各种文本进行承载,而且数据可能会比较混乱,需要我们理清楚数据,并对这些数据进行汇总

表格结构数据使用方法

单元格值的引用方法

  • 引用同一工作表内单元格值:通过"=列号+行号"定位单元格
  • 引用单元格值:通过"表名!+列号+行号"定位单元格

单元格区域值的引用方法

单元格区域:

  • a.单元格区域需要由连续的单元格构成
  • b.单元格区域需要是一个方形区域

表格结构数据查询方法

查询方法:

  • a.使用表格工具搜索功能查询
  • b.使用查询函数进行查询

函数

函数构成五部分:

  • a,"="等号的意义是告诉计算机,我从现在要使用函数进行计算了,是对计算机进行函数使用宣言
  • b,函数表达式:函数表达式由函数名以及括号两部分构成,不同函数表达式代表不同的函数功能
  • c,参数进行函数计算时参照的计算依据
  • d,操作符有特殊意义的字符
  • e,返回值使用函数进行计算的目的就是为了得到计算结果,计算结果就是返回值

用查询函数进行查找

拆解查询函数VLOOKUP:

  • a,"="告诉计算机我接下来写vlookup内容不是文本值而是函数
  • b,函数表达式"vlookup()"是完整函数表达式,作用是在制定范围内查找与条件值匹配的单元格值
  • c,参数"vlookup"函数有四个参数
  • c-1:第一个参数"E2",以"E2"单元格值作为查询条件
  • c-2:第二个参数"A:B",查找范围在"A:B"的单元格区域内进行查询,查询范围中的第一列"A"列为查询匹配列,在"A"列中找到与"E2"查询条件值相同的第一个单元格值
  • c-3:第三个参数"2",查找范围内的顺序号,在A:B两列中取第二列上的单元格值
  • c-4:第四个参数"False",查找方式,false代表精确匹配,只在查询范围内匹配与条件值"E2"单元格值"李四"完全相同的单元格值
    d,操作符",",用来分隔四个不同参数
    e,返回值"F2",单元格中"8000",找到的"李四"的工资值

表格结构数据的计算方法-直接计算

直接计算:使用运算符连接单元格或单元格区域进行计算

表格结构数据的计算方法-函数计算

函数计算:使用函数对单元格及单元格区域值进行并返回计算结果

相关推荐
生信碱移1 小时前
PACells:这个方法可以鉴定疾病/预后相关的重要细胞亚群,作者提供的代码流程可以学习起来了,甚至兼容转录组与 ATAC 两种数据类型!
人工智能·学习·算法·机器学习·数据挖掘·数据分析·r语言
wuweijianlove5 小时前
算法的平均复杂度建模与性能回归分析的技术7
算法·数据挖掘·回归
高洁016 小时前
大模型部署资源不足?轻量化部署解决方案
python·深度学习·机器学习·数据挖掘·transformer
ClkLog-开源埋点用户分析7 小时前
在信创环境下,如何判断一套用户行为分析系统是否“真正可用”?
数据分析·开源·开源软件·用户画像·埋点系统
SelectDB8 小时前
Doris & SelectDB for AI 实战:从基础 RAG 到知识图谱增强的完整实现
数据库·人工智能·数据分析
AI科技星11 小时前
人类首张【全域数学公理体系】黑洞内部结构图—基于「0-1-∞」三元本源的全维深度解析
人工智能·算法·机器学习·数学建模·数据挖掘·量子计算
啦啦啦_999911 小时前
案例之 波士顿房价预测(线性回归之正规方程/ 梯度下降!!)
人工智能·数据挖掘·回归
SL-staff11 小时前
中小企业 BI 选型:帆软、Power BI、JVS-BI 性价比与架构对比
数据分析·数据可视化·powerbi·帆软·bi工具·部署架构·jvs-bi
数智工坊12 小时前
【SIoU Loss论文阅读】:引入角度感知的框回归损失,让检测收敛更快更准
论文阅读·人工智能·深度学习·机器学习·数据挖掘·回归·cnn
bloglin9999912 小时前
向量大模型升级可能改变向量空间(需要回归)
人工智能·数据挖掘·回归