大数据分析入门10分钟快速了解SQL

SQL是什么?

SQL全称Structured Query Language(结构化查询语言")

为什么要用SQL?

SQL通用

常见的表格分析操作,Excel也能做,为什么不用呢?

因为处理上亿行大数据时,Excel并不够用。

而常见的大数据引擎Hive、Spark、Flink都支持SQL,SQL在大数据中是通用语言。

SQL易用

Python和Java需要自己写算法,而SQL只需要描述结果,相比写算法简单太多了。

怎么用SQL?

只需要记住你有什么数据,想要什么数据。

再找相应的语法例子,自己改一改就会用了。

简单查询(SELECT)

你有一张users表,表中有id,name,age,city_code四个字段。

如果你想要知道name为张三的人的信息,那么SQL是

sql 复制代码
select id,name,city_code 
from users where name = '张三'

排序查询(ORDER BY)

如果你想看看最年长的10位,那么SQL是

sql 复制代码
select id,name,city_code 
from users 
order by age desc -- desc表降序,asc表示升序
limit 10

聚合查询(GROUP BY)

如果你想要知道每个城市有多少人,那么SQL是

sql 复制代码
select count(id) as cnt  
from users 
group by city_code

连接查询(JOIN)

你有一张cities表,会有city_code,city_name字段。

它如同"邮政编码"和"地区"一样将"100000"映射到"北京"。

如果users直接存city_name,当city_name变化时,需要修改users表的多行 ;而有了cities,只需要改cities表中的1行

如果你想要知道每个人所在城市名称,那么SQL是

sql 复制代码
select name, city_name
from users
join cities
on users.city_code=cities.city_code

总结

10分钟带你了解了SQL的大概,但SQL远不止这些。

欢迎提出你遇到的SQL问题,我会针对性的出一些教程解答大家问题的~

相关推荐
m***记1 分钟前
Python 数据分析入门:Pandas vs NumPy 全方位对比
python·数据分析·pandas
DokiDoki之父1 小时前
Mybatis—入门 & (配置)SQL提示和日志输出
数据库·sql·mybatis
西贝爱学习5 小时前
2025电脑价格数据集/构建电脑价格预测模型/数据量为 10 万行
数据分析·电脑
中达瑞和-高光谱·多光谱6 小时前
多光谱图像颜色特征用于茶叶分类的研究进展
人工智能·分类·数据挖掘
Q26433650237 小时前
【有源码】基于Python与Spark的火锅店数据可视化分析系统-基于机器学习的火锅店综合竞争力评估与可视化分析-基于用户画像聚类的火锅店市场细分与可视化研究
大数据·hadoop·python·机器学习·数据分析·spark·毕业设计
TDengine (老段)17 小时前
TDengine 数学函数 DEGRESS 用户手册
大数据·数据库·sql·物联网·时序数据库·iot·tdengine
weixin_5195357717 小时前
从ChatGPT到新质生产力:一份数据驱动的AI研究方向指南
人工智能·深度学习·机器学习·ai·chatgpt·数据分析·aigc
武子康18 小时前
Java-152 深入浅出 MongoDB 索引详解 从 MongoDB B-树 到 MySQL B+树 索引机制、数据结构与应用场景的全面对比分析
java·开发语言·数据库·sql·mongodb·性能优化·nosql
武昌库里写JAVA1 天前
C语言 函数指针和指针函数区别 - C语言零基础入门教程
vue.js·spring boot·sql·layui·课程设计
青云交1 天前
Java 大视界 -- Java 大数据在智能电网电力市场交易数据分析与策略制定中的关键作用
数据分析·数据采集·数据存储·交易策略·智能电网·java 大数据·电力市场交易