【数据分析】数据结构数据内容概述

文章目录

表格结构数据特征

数据类别

数据分为结构化和非结构化数据,像企业当中常用的销售表、工资表、员工表等字段和数据体现的为结构化,而图片、视频、聊天记录等不同于销售表、工资表的数据为非结构化数据。我们在日常工作中接触最多的主要是结构化数据,这也是我们分析的重点

结构化数据

结构化数据从企业的系统读取,例如从CRM系统、ERP系统、OA系统等导入,整理成表格形式,通过Excel、WPS、Nubers进行打开进行统计分析,也可以直接用例如数据库、ETL工具、可视化工具进行读取和展示

表格结构数据层级

结构化数据我们常用Excel进行打开,像一个Excel我们称作工作薄,而一个工作薄下面可以包含若干张工作表,默认为Sheet1、Sheet2、Sheet3...命名,在每一个工作表里面有若干的表格,像我们常用的D3:G12是选择数据的区域范围,单独选择一个单元格称为D7

表格结构的数据类型

表格结构是我们日常接触最多的,主要包含:数值型、文本型、逻辑型

单元格的格式属性

每个单元格承担的不同的属性,例如销售用数值表示则为125、11这些数值属性,日期则是日期格式

在Excel中还包括显示格式,则是用不同的显示格式来展示数据,例如字体加粗、倾斜等格式

表格结构数据获取方法

从企业后台数据库系统获取

在企业中,像我们使用的OA系统、CRM系统、金蝶财务系统等等,填入了一些数据、产生的一些数据都会被记录到数据库中,在数据库中会存放着许多的存储表,用户表、品牌表、销售表等,我们的技术人员可以通过SQL语句直接跟数据库交流,获取到想要的数据,然后通过文本文件、Excel、BI可视化等进行展示

后台数据库系统获取数据流程

  • 需求中的业务描述部分应尽量准确、详细、易懂
  • 需求中的数据使用部分的描述应尽量做到条理清洗、逻辑严谨、细节描述要详细
  • 需求描述结束后需要确认数据库管理人员听懂并且理解了需求内容
  • 向数据库管理人员咨询获取数据的方案,与数据库管理人员一起逐一核对方案细节

前端操作平台获取

前端操作人员可以直接从ERP、CRM等系统直接导出数据,可以解决部分需求。如果需求比较复杂或特定,还是需要数据库管理人员协助,写SQL进行提取

从企业外部渠道获取数据

企业在某些情况下需要获取外部的数据,这些数据可能会通过各种文本进行承载,而且数据可能会比较混乱,需要我们理清楚数据,并对这些数据进行汇总

表格结构数据使用方法

单元格值的引用方法

  • 引用同一工作表内单元格值:通过"=列号+行号"定位单元格
  • 引用单元格值:通过"表名!+列号+行号"定位单元格

单元格区域值的引用方法

单元格区域:

  • a.单元格区域需要由连续的单元格构成
  • b.单元格区域需要是一个方形区域

表格结构数据查询方法

查询方法:

  • a.使用表格工具搜索功能查询
  • b.使用查询函数进行查询

函数

函数构成五部分:

  • a,"="等号的意义是告诉计算机,我从现在要使用函数进行计算了,是对计算机进行函数使用宣言
  • b,函数表达式:函数表达式由函数名以及括号两部分构成,不同函数表达式代表不同的函数功能
  • c,参数进行函数计算时参照的计算依据
  • d,操作符有特殊意义的字符
  • e,返回值使用函数进行计算的目的就是为了得到计算结果,计算结果就是返回值

用查询函数进行查找

拆解查询函数VLOOKUP:

  • a,"="告诉计算机我接下来写vlookup内容不是文本值而是函数
  • b,函数表达式"vlookup()"是完整函数表达式,作用是在制定范围内查找与条件值匹配的单元格值
  • c,参数"vlookup"函数有四个参数
  • c-1:第一个参数"E2",以"E2"单元格值作为查询条件
  • c-2:第二个参数"A:B",查找范围在"A:B"的单元格区域内进行查询,查询范围中的第一列"A"列为查询匹配列,在"A"列中找到与"E2"查询条件值相同的第一个单元格值
  • c-3:第三个参数"2",查找范围内的顺序号,在A:B两列中取第二列上的单元格值
  • c-4:第四个参数"False",查找方式,false代表精确匹配,只在查询范围内匹配与条件值"E2"单元格值"李四"完全相同的单元格值
    d,操作符",",用来分隔四个不同参数
    e,返回值"F2",单元格中"8000",找到的"李四"的工资值

表格结构数据的计算方法-直接计算

直接计算:使用运算符连接单元格或单元格区域进行计算

表格结构数据的计算方法-函数计算

函数计算:使用函数对单元格及单元格区域值进行并返回计算结果

相关推荐
卑微小文37 分钟前
消费金融用户画像构建:代理 IP 整合多维度信息
爬虫·数据挖掘·数据分析
lilye661 小时前
程序化广告行业(39/89):广告投放的数据分析与优化秘籍
大数据·人工智能·数据分析
橘猫云计算机设计4 小时前
基于ssm的食物营养成分数据分析平台设计与实现(源码+lw+部署文档+讲解),源码可白嫖!
后端·python·信息可视化·数据挖掘·数据分析·django·毕业设计
谁家有个大人5 小时前
数据分析问题思考路径
数据库·数据分析
慕丹6 小时前
虫洞数观系列三 | 数据分析全链路实践:Pandas清洗统计 + Navicat可视化呈现
python·mysql·数据挖掘·数据分析·pandas
Mostcow9 小时前
数据分析_Data-Formulator-0.1.7调用Ollama-0.5问题记录
人工智能·数据挖掘·数据分析
Hali_Botebie10 小时前
【蒸馏用损失】NCEloss介绍,大规模分类任务的损失函数
人工智能·分类·数据挖掘
北洛学Ai20 小时前
DeepSeek接入飞书多维表格,效率起飞!
信息可视化·数据挖掘·数据分析
谱度众合1 天前
组学数据分析实操系列 | (六)蛋白相互作用域可视化分析
数据挖掘·数据分析
十三画者1 天前
【工具】BioPred一个用于精准医疗中生物标志物分析的 R 软件包
数据挖掘·数据分析·r语言·数据可视化