目录

Hive超市零售案例

超市零售案例

一、部分数据展示

markdown 复制代码
Fiskars 剪刀| 蓝色,61,中国,华东,杭州,用品,曾惠,2,浙江,办公用品,US-2019-1357144,130
GlobeWeis 搭扣信封| 红色,43,中国,西南,内江,信封,许安,2,四川,办公用品,CN-2019-1973789,125
Cardinal 孔加固材料| 回收,4,中国,西南,内江,装订机,许安,2,四川,办公用品,CN-2019-1973789,32
Kleencut 开信刀| 工业,27,中国,华东,镇江,用品,宋良,4,江苏,办公用品,US-2019-3017568,321
KitchenAid 搅拌机| 黑色,550,中国,中南,汕头,器具,万兰,3,广东,办公用品,CN-2018-2975416,1376
柯尼卡 打印机| 红色,3784,中国,华东,景德镇,设备,俞明,9,江西,技术,CN-2017-4497736,11130
柯尼卡 打印机| 红色,3784,中国,华东,景德镇,设备,俞明,9,江西,技术,CN-2017-4497736,11130
柯尼卡 打印机| 红色,3784,中国,华东,景德镇,设备,俞明,9,江西,技术,CN-2017-4497736,11130
柯尼卡 打印机| 红色,3784,中国,华东,景德镇,设备,俞明,9,江西,技术,CN-2017-4497736,11130
柯尼卡 打印机| 红色,3784,中国,华东,景德镇,设备,俞明,9,江西,技术,CN-2017-4497736,11130
Ibico 订书机| 实惠,173,中国,华东,景德镇,装订机,俞明,2,江西,办公用品,CN-2017-4497736,480
Ibico 订书机| 实惠,173,中国,华东,景德镇,装订机,俞明,2,江西,办公用品,CN-2017-4497736,480
Ibico 订书机| 实惠,173,中国,华东,景德镇,装订机,俞明,2,江西,办公用品,CN-2017-4497736,480
Ibico 订书机| 实惠,173,中国,华东,景德镇,装订机,俞明,2,江西,办公用品,CN-2017-4497736,480
Ibico 订书机| 实惠,173,中国,华东,景德镇,装订机,俞明,2,江西,办公用品,CN-2017-4497736,480
SAFCO 扶手椅| 可调,2684,中国,华东,景德镇,椅子,俞明,4,江西,家具,CN-2017-4497736,8660
SAFCO 扶手椅| 可调,2684,中国,华东,景德镇,椅子,俞明,4,江西,家具,CN-2017-4497736,8660
SAFCO 扶手椅| 可调,2684,中国,华东,景德镇,椅子,俞明,4,江西,家具,CN-2017-4497736,8660
SAFCO 扶手椅| 可调,2684,中国,华东,景德镇,椅子,俞明,4,江西,家具,CN-2017-4497736,8660
SAFCO 扶手椅| 可调,2684,中国,华东,景德镇,椅子,俞明,4,江西,家具,CN-2017-4497736,8660
Green Bar 计划信息表| 多色,47,中国,华东,景德镇,纸张,俞明,5,江西,办公用品,CN-2017-4497736,588
Green Bar 计划信息表| 多色,47,中国,华东,景德镇,纸张,俞明,5,江西,办公用品,CN-2017-4497736,588
Green Bar 计划信息表| 多色,47,中国,华东,景德镇,纸张,俞明,5,江西,办公用品,CN-2017-4497736,588
Green Bar 计划信息表| 多色,47,中国,华东,景德镇,纸张,俞明,5,江西,办公用品,CN-2017-4497736,588
Green Bar 计划信息表| 多色,47,中国,华东,景德镇,纸张,俞明,5,江西,办公用品,CN-2017-4497736,588
Stockwell 橡皮筋| 整包,34,中国,华东,景德镇,系固件,俞明,2,江西,办公用品,CN-2017-4497736,154
Stockwell 橡皮筋| 整包,34,中国,华东,景德镇,系固件,俞明,2,江西,办公用品,CN-2017-4497736,154
Stockwell 橡皮筋| 整包,34,中国,华东,景德镇,系固件,俞明,2,江西,办公用品,CN-2017-4497736,154
Stockwell 橡皮筋| 整包,34,中国,华东,景德镇,系固件,俞明,2,江西,办公用品,CN-2017-4497736,154
Stockwell 橡皮筋| 整包,34,中国,华东,景德镇,系固件,俞明,2,江西,办公用品,CN-2017-4497736,154
爱普生 计算器| 耐用,4,中国,西北,榆林,设备,谢雯,2,陕西,技术,CN-2016-4195213,434
惠普 墨水| 红色,640,中国,东北,哈尔滨,复印机,康青,4,黑龙江,技术,CN-2019-5801711,2369
Jiffy 局间信封| 银色,89,中国,华东,青岛,信封,赵婵,3,山东,办公用品,CN-2017-2752724,684
SanDisk 键区| 可编程,344,中国,华东,青岛,配件,赵婵,5,山东,技术,CN-2017-2752724,1327
诺基亚 充电器| 蓝色,2849,中国,华东,青岛,电话,赵婵,2,山东,技术,CN-2017-2752724,5937
KitchenAid 冰箱| 黑色,3963,中国,华东,徐州,器具,刘斯云,7,江苏,办公用品,US-2018-2511714,10336
Novimex 圆形标签| 红色,38,中国,华东,徐州,标签,刘斯云,3,江苏,办公用品,US-2018-2511714,85
Memorex 键盘| 实惠,1071,中国,华东,上海,配件,白鹄,7,上海,技术,CN-2019-5631342,2330
Memorex 键盘| 实惠,1071,中国,华东,上海,配件,白鹄,7,上海,技术,CN-2019-5631342,2330
Avery 孔加固材料| 耐用,2,中国,华东,上海,装订机,白鹄,5,上海,办公用品,CN-2019-5631342,138
Avery 孔加固材料| 耐用,2,中国,华东,上海,装订机,白鹄,5,上海,办公用品,CN-2019-5631342,138

二、数据表准备

1.创建数据表

sql 复制代码
hive>create table supermarket(
Product_name string,
profit int,
country string,
region string,
city string,
Subcategory string,
Customer_name string,
number int,
province string,
category string,
order_id string,
sales_volume int
)row format delimited fields terminated by ',';

2.加载数据

sql 复制代码
hive>load data local inpath '/usr/local/src/datas/super.csv'into table supermarket;

三、需求

1.需求一

markdown 复制代码
  对于连锁商场来说,不同类型店铺的所带来的销售额也大不相同,例如大型综合超市的月销售额与同品牌定位在小区门口的社区便利店是不可而语的。但同时,大型综合超市的选址、占地、员工人数众多,相应的经营成本也很高。请以产品类型作为衡量维度,使用相关数据集求出各个产品所占百分比,结果保留两位小数。
sql 复制代码
hive>select category, concat(round(ratio,2), ' %')ratio from(select (count(*) over(partition by category)/count(*) over() )*100 as ratio,category from supermarket) re group by category,ratio;
markdown 复制代码
办公用品        69.03 %
家具    9.68 %
技术    21.29 %

2.需求二

markdown 复制代码
 公司计划在今年新增 25 家连锁门店,目标整体营业额全国销售突破 580 亿。由于不同地区因经济发展水平,居民消费能力等差异,所带来的商品销售情况也各不相同。请根据现有数据以地区为维度进行销售额汇总。
sql 复制代码
hive> select region,sum(sales_volume) from supermarket group by region;
mar 复制代码
东北    3049
中南    51873
华东    315426
华北    4014
西北    4412
西南    6546

3.需求三

markdown 复制代码
  销售数据分析工作涉及到销售成本分析、客户满意度分析、客户需求分析等。为了进行销售数据分析,需要对数据统计和分类,了解销售状态,并进一步做出决策。针对同一市场不同品牌产品的销售差异分析,可为企业的销售策略提供建议和参考;针对不同市场的同一品牌产品的销售差异分析, 可为企业的市场策略提供建议和参考;微观销售分析,可分析决定未能达到销售额的特定产品、地区等。销售分析可以决定一个商场的经营方向。请根据相关数据文件按照题目具体要求,分析商场销售数据。

3.1 求东北地区各个产品类别的销售量占东北地区总销售量的比率

分析语句:

markdown 复制代码
地区:东北   --where 过滤,只取东北地区
查询内容:category(产品类别)、ratio(比率) --比率要自己通过函数计算
比率计算:
		1.(sum(number) over(partition by category) --以产品类别作为分区计算出产品销售总量
		2. sum(number) over() --销售总量
		3. *100 --求百分比
		4. as ratio,region,category --地区产品类别的比率
		5. from supermarket --来自这张表
		6. where region='东北' -- 只要东北地区的,你也可以去搞其他地区的
		
汇总:
		1.concat(round(num,2),'%'):拼接字符串 --在统计结果后面加上%
		2.round(num,2):取小数点后两位
		3.re:比率计算数据集的别名
sql 复制代码
hive> select category,concat(round(num,2),'%')num from (select (sum(number) over(partition by category)/sum(number) over() )*100 as num,region,category from supermarket where  region='东北')re group by category,num;
markdown 复制代码
办公用品        76.47%
技术    23.53%

3.2 求各个地区的办公用品这个类别物品的销售量占总销售量的比率

sql 复制代码
hive>select region,category,concat(round(num,2), '%')num from (select (sum(number) over(partition by region)/sum(number) over() )*100 as num,region,category from supermarket where  category='办公用品')re group by region,category,num;
markdown 复制代码
东北    办公用品        2.9%
中南    办公用品        3.79%
华东    办公用品        84.15%
华北    办公用品        0.45%
西北    办公用品        4.91%
西南    办公用品        3.79%
本文是转载文章,点击查看原文
如有侵权,请联系 xyy@jishuzhan.net 删除
相关推荐
你觉得2053 小时前
哈尔滨工业大学DeepSeek公开课:探索大模型原理、技术与应用从GPT到DeepSeek|附视频与讲义下载方法
大数据·人工智能·python·gpt·学习·机器学习·aigc
啊喜拔牙3 小时前
1. hadoop 集群的常用命令
java·大数据·开发语言·python·scala
别惊鹊3 小时前
MapReduce工作原理
大数据·mapreduce
8K超高清3 小时前
中国8K摄像机:科技赋能文化传承新图景
大数据·人工智能·科技·物联网·智能硬件
2401_871290585 小时前
MapReduce 的工作原理
大数据·mapreduce
啊迷诺斯5 小时前
hadoop的常用命令
hadoop
SelectDB技术团队5 小时前
Apache Doris 2025 Roadmap:构建 GenAI 时代实时高效统一的数据底座
大数据·数据库·数据仓库·人工智能·ai·数据分析·湖仓一体
你觉得2056 小时前
浙江大学朱霖潮研究员:《人工智能重塑科学与工程研究》以蛋白质结构预测为例|附PPT下载方法
大数据·人工智能·机器学习·ai·云计算·aigc·powerpoint
益莱储中国6 小时前
世界通信大会、嵌入式展及慕尼黑上海光博会亮点回顾
大数据
Loving_enjoy7 小时前
基于Hadoop的明星社交媒体影响力数据挖掘平台:设计与实现
大数据·hadoop·数据挖掘