漫画sql数据分析

第一章

数据分析概况

1.1数据分析定义

数据分析是指根据分析目的,用适当的分析方法及工具,对数据进行处理分析,提取有价值的信息,形成有效结论的过程。

1.2数据分析作用

数据分析在我们日常工作中主要有三大作用,分别是:现状分析、原因分析、预测分析。

1.3数据分析步骤

明确分析目的和思路》数据收集》数据处理》分析数据》数据展现》报告撰写

数据分析师一般采用sql语句对数据库中的数据进行处理、分析。

select count(*) from user;

数据收集来源主要有数据库、出版物、互联网、市场调查

数据处理主要包括,数据导入导出、数据清洗、数据转换、数据抽取、数据合并、数据计算

SQL是结构化查询语言。简单来说,他就是让数据库根据我们的要求进行查询并得到相应数据的操作语言。SQL是一种通用的关系型数据库操作语言,这类数据库包括MySQL,Oracle、SQL Server、Access等。

第2章

数据库与SQL概况

2.1数据库简介

数据库是按照数据结构组织、存储和管理数据的仓库。通过数据库可以对数据进行存储、处理和分析。

2.1.2常用数据库

如今最常见的数据库主要有两种,关系型数据库和非关系型数据库。

关系型数据库

采用关系模型组织数据的数据库,以行和列的形式存储数据,形成数据表,一组数据表组成了数据库。

非关系型数据库

在严格意义上不是一种数据库,应该是一种数据结构化存储方法的集合,可以是文档或者键值对等。

处理大数据Hadoop所使用的Hive语言(Hive),也与SQL基本一致,掌握了SQL,再学习HQL就非常容易了。

使用SQL进行数据分析,在数据库中主要的操作就是数据去重、数据合并、数据拆分、数据分组、数据统计等数据处理及分析工作,这些操作都是通过SELECT语句来完成的。

select字段

from表

where过滤行条件

group by字段

having过滤组条件

order by字段

需要将前几条数据记录查询出来

mysql数据库limit用法

select字段

from表

limit n

创建表语法

create table 表名(字段1 数据类型1,......字段n 数据类型n);

mysql数据库常用的数据类型

字符型:varchar、char、text

整数型:int、smallint、bigint

浮点型:float、double

日期、时间型:time、date、datetime、timestamp

mysql数据库将查询结果保存至新表用法

create table 新表 as

select 字段

from 数据源(表或查询)

SQL语句中,SELECT、FROM等关键字使用大写或小写形式均可。在编写SQL语句时,建议尽量统一关键字的大小写。例如,以大写字母的形式输入关键字,一小写字母的形式输入表名或字段名。清晰明了。

第3章

数据处理

在日常工作中,受系统bug或人为等原因影响,难免会出现数据错误、数据缺失、数据重复等问题。具有此类问题的数据通常被称为脏数据库。我们可以按照一定的规则将脏数据处理干净,这个操作被称为数据清洗。

数据清洗的目的就是将原始数据转化为可以进行分析的数据,使数据保持准确性、一致性、有效性。

where子句用法

select字段

from表

where条件表达式

条件表达式常用运算符

|-------|-------------------------------------------------------------------------------------------------|
| 类型 | 说明 |
| 算数运算符 | + - * / %(取余) |
| 关系运算符 | = > < >= <= != <> in not in between and not between and like not like is null is not null |
| 逻辑运算符 | and or not |

第4章

数据分析

数据分析作用、方法对应表

|--------|------|----------------------------------------------------------------|
| 数据分析作用 | 基本方法 | 数据分析方法 |
| 现状分析 | 对比 | 对比分析 描述性分析 分组分析 结构分析 分布分析 交叉分析 矩阵分析 RFM分析 综合评价分析 留存分析 生命周期价值分析 |
| 原因分析 | 细分 | 结构分解法 因素分解法 转化分析 |
| 预测分析 | 预测 | 相关分析 回归分析 时间序列 |

相关推荐
Hcoco_me8 小时前
LLM(Large Language Model)系统学习路线清单
人工智能·算法·自然语言处理·数据挖掘·聚类
Elastic 中国社区官方博客8 小时前
Kibana:使用 ES|QL 构建地图,对国家或地区的指标进行对比
大数据·数据库·elasticsearch·搜索引擎·信息可视化·全文检索·kibana
fuzamei8888 小时前
AI+区块链:为数字金融构建可信交易底座—吴思进出席“中国数字金融独角兽榜单2025交流会”
大数据·人工智能
盟接之桥8 小时前
盟接之桥--说制造:从“找缝隙”到“一万米深”——庖丁解牛式的制造业精进之道
大数据·前端·数据库·人工智能·物联网·制造
司马阅-SmartRead9 小时前
学术研究与产业实践深度融合:司马阅AI合伙人冀文辉亮相「首届创新管理与JPIM论文工作坊」,产学研一体化推动企业AI落地
大数据·人工智能
kk哥88999 小时前
Git 远程仓库操作
大数据·git·elasticsearch
林义满10 小时前
大促零宕机背后的运维升级:长三角中小跨境电商的架构优化实践
大数据·运维·架构
梦帮科技10 小时前
Scikit-learn特征工程实战:从数据清洗到提升模型20%准确率
人工智能·python·机器学习·数据挖掘·开源·极限编程
公链开发11 小时前
链游开发全路径赋能:如何重塑从创意到生态的完整闭环
大数据·人工智能·ux
APItesterCris11 小时前
高并发场景下的挑战:1688 商品 API 的流量控制、缓存策略与异步处理方案
大数据·开发语言·数据库·缓存