大数据分析入门10分钟快速了解SQL

SQL是什么?

SQL全称Structured Query Language(结构化查询语言")

为什么要用SQL?

SQL通用

常见的表格分析操作,Excel也能做,为什么不用呢?

因为处理上亿行大数据时,Excel并不够用。

而常见的大数据引擎Hive、Spark、Flink都支持SQL,SQL在大数据中是通用语言。

SQL易用

Python和Java需要自己写算法,而SQL只需要描述结果,相比写算法简单太多了。

怎么用SQL?

只需要记住你有什么数据,想要什么数据。

再找相应的语法例子,自己改一改就会用了。

简单查询(SELECT)

你有一张users表,表中有id,name,age,city_code四个字段。

如果你想要知道name为张三的人的信息,那么SQL是

sql 复制代码
select id,name,city_code 
from users where name = '张三'

排序查询(ORDER BY)

如果你想看看最年长的10位,那么SQL是

sql 复制代码
select id,name,city_code 
from users 
order by age desc -- desc表降序,asc表示升序
limit 10

聚合查询(GROUP BY)

如果你想要知道每个城市有多少人,那么SQL是

sql 复制代码
select count(id) as cnt  
from users 
group by city_code

连接查询(JOIN)

你有一张cities表,会有city_code,city_name字段。

它如同"邮政编码"和"地区"一样将"100000"映射到"北京"。

如果users直接存city_name,当city_name变化时,需要修改users表的多行 ;而有了cities,只需要改cities表中的1行

如果你想要知道每个人所在城市名称,那么SQL是

sql 复制代码
select name, city_name
from users
join cities
on users.city_code=cities.city_code

总结

10分钟带你了解了SQL的大概,但SQL远不止这些。

欢迎提出你遇到的SQL问题,我会针对性的出一些教程解答大家问题的~

相关推荐
是上好佳佳佳呀1 小时前
【数据分析|DAY01】Series 和 DataFrame 笔记
笔记·数据分析
程序员猫哥_1 小时前
AI建站工具选型指南:不同模式对比与筛选标准
数据挖掘
Jelena157795857921 小时前
主流电商平台(淘宝/1688/京东/拼多多)商品比价与数据分析实战指南
大数据·人工智能·数据分析
dongf20191 小时前
R语言线性回归
数据分析·r语言·线性回归
KaMeidebaby9 小时前
卡梅德生物技术快报|PD1 单克隆抗体定制配套 N 糖全谱质控开发
前端·人工智能·算法·数据挖掘·数据分析
胖胖胖胖胖虎13 小时前
SQL json_table 行转列方法
sql
网管NO.113 小时前
子查询进阶|EXISTS/IN/ANY/ALL,优化查询效率
数据库·sql
小飞象—木兮13 小时前
《如何搭建用户分析体系指南》:定义、价值、思路、全流程实操指南、底层逻辑与落地方法···
数据分析·用户运营·用户体验
电商API_1800790524716 小时前
免 TOP 入驻,第三方淘宝商品详情 API 快速接入与代码示例
java·大数据·开发语言·数据库·爬虫·数据分析
程序员猫哥_16 小时前
AI建站避坑指南:10个核心问题与客观解答
数据挖掘