Hive3:常用查询语句整理

一、数据准备

建库

sql 复制代码
CREATE DATABASE itheima;
USE itheima;

订单表

sql 复制代码
CREATE TABLE itheima.orders (
                                orderId bigint COMMENT '订单id',
                                orderNo string COMMENT '订单编号',
                                shopId bigint COMMENT '门店id',
                                userId bigint COMMENT '用户id',
                                orderStatus tinyint COMMENT '订单状态 -3:用户拒收 -2:未付款的订单 -1:用户取消 0:待发货 1:配送中 2:用户确认收货',
                                goodsMoney double COMMENT '商品金额',
                                deliverMoney double COMMENT '运费',
                                totalMoney double COMMENT '订单金额(包括运费)',
                                realTotalMoney double COMMENT '实际订单金额(折扣后金额)',
                                payType tinyint COMMENT '支付方式,0:未知;1:支付宝,2:微信;3、现金;4、其他',
                                isPay tinyint COMMENT '是否支付 0:未支付 1:已支付',
                                userName string COMMENT '收件人姓名',
                                userAddress string COMMENT '收件人地址',
                                userPhone string COMMENT '收件人电话',
                                createTime timestamp COMMENT '下单时间',
                                payTime timestamp COMMENT '支付时间',
                                totalPayFee int COMMENT '总支付金额'
) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t';

LOAD DATA LOCAL INPATH '/home/atguigu/itheima_orders.txt' INTO TABLE itheima.orders;

用户表

sql 复制代码
CREATE TABLE itheima.users (
                               userId int,
                               loginName string,
                               loginSecret int,
                               loginPwd string,
                               userSex tinyint,
                               userName string,
                               trueName string,
                               brithday date,
                               userPhoto string,
                               userQQ string,
                               userPhone string,
                               userScore int,
                               userTotalScore int,
                               userFrom tinyint,
                               userMoney double,
                               lockMoney double,
                               createTime timestamp,
                               payPwd string,
                               rechargeMoney double
) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t';

LOAD DATA LOCAL INPATH '/home/atguigu/itheima_users.txt' INTO TABLE itheima.users;

二、基本查询

查询数据量

sql 复制代码
SELECT COUNT(*) FROM itheima.orders;

过滤广东省订单

sql 复制代码
SELECT * FROM itheima.orders WHERE useraddress LIKE '%广东%';

找出广东省单笔营业额最大的订单

sql 复制代码
SELECT * FROM itheima.orders WHERE useraddress like '%广东%' ORDER BY totalmoney DESC LIMIT 1;

三、分组、聚合

统计未支付、已支付各自的人数

sql 复制代码
SELECT ispay, COUNT(*) AS cnt FROM itheima.orders GROUP BY ispay;

在已付款订单中,统计每个用户最高的一笔消费金额

sql 复制代码
SELECT userid, MAX(totalmoney) AS max_money FROM itheima.orders WHERE ispay = 1 GROUP BY userid;

统计每个用户的平均订单消费额

sql 复制代码
SELECT userid, AVG(totalmoney) FROM itheima.orders GROUP BY userid;

统计每个用户的平均订单消费额,过滤大于10000的数据

sql 复制代码
SELECT userid, AVG(totalmoney) AS avg_money FROM itheima.orders GROUP BY userid HAVING avg_money > 10000;

四、JOIN

JOIN订单表和用户表,找出用户名

sql 复制代码
SELECT o.orderid, o.userid, u.username, o.totalmoney, o.useraddress, o.paytime FROM itheima.orders o JOIN itheima.users u ON o.userid = u.userid;

左外关联,订单表和用户表,找出用户名

sql 复制代码
SELECT o.orderid, o.userid, u.username, o.totalmoney, o.useraddress, o.paytime FROM itheima.orders o LEFT JOIN itheima.users u ON o.userid = u.userid;

五、UNIO

去重联合的查询结果

sql 复制代码
SELECT * FROM course
UNION 
SELECT * FROM course

不去重联合的查询结果

sql 复制代码
SELECT * FROM course
    UNION ALL 
SELECT * FROM course

六、RLIKE正则查询

常用匹配规则

sql 复制代码
-- 查找广东省数据
SELECT * FROM itheima.orders WHERE useraddress RLIKE '.*广东.*';
-- 查找用户地址是:xx省 xx市 xx区
SELECT * FROM itheima.orders WHERE useraddress RLIKE '..省 ..市 ..区';
-- 查找用户姓为:张、王、邓
SELECT * FROM itheima.orders WHERE username RLIKE '[张王邓]\\S+';
-- 查找手机号符合:188****0*** 规则
SELECT * FROM itheima.orders WHERE userphone RLIKE '188\\S{4}0[0-9]{3}';
相关推荐
兔子宇航员030111 小时前
HIVE SQL 中 NULL 值在 JOIN 和 GROUP BY 中的致命陷阱与解决方案
hive·hadoop·sql
段一凡-华北理工大学14 小时前
工业领域的Hadoop架构学习~系列文章02:HDFS架构深度剖析
大数据·人工智能·hadoop·学习·架构·高炉炼铁
Irene199115 小时前
Oracle(字符集分为服务端和客户端) 和 Hive(依赖 MySQL(或 PostgreSQL)存储元数据)字符集编码格式查询,中文乱码处理
hive·sql·oracle
段一凡-华北理工大学16 小时前
工业领域的Hadoop架构学习~系列文章03:MapReduce编程模型深度解读
大数据·人工智能·hadoop·学习·架构·高炉炼铁·高炉智能化
无关868816 小时前
StarRocks 存算分离 + Spark + Hive Metastore + MinIO 数据湖搭建全流程
大数据·hive·spark
小欣加油2 天前
Hadoop开发环境搭建
大数据·数据库·hadoop
段一凡-华北理工大学2 天前
工业领域的Hadoop架构学习~系列文章01:Hadoop与工业4.0深度融合
大数据·hadoop·学习·架构·知识图谱·高炉炼铁·工业智能体
小欣加油3 天前
Hive综合应用案例——用户学历查询
数据仓库·hive·hadoop
至此流年莫相忘3 天前
CentOS 部署 Hadoop 环境指导文档
linux·hadoop·centos
yumgpkpm3 天前
Hadoop(CDH6、CDP7)在Qwen3.7大模型训练中的作用,(含部署、运行操作步骤)
大数据·hive·hadoop·分布式·zookeeper·spark·kafka