Hive超市零售案例

超市零售案例

一、部分数据展示

markdown 复制代码
Fiskars 剪刀| 蓝色,61,中国,华东,杭州,用品,曾惠,2,浙江,办公用品,US-2019-1357144,130
GlobeWeis 搭扣信封| 红色,43,中国,西南,内江,信封,许安,2,四川,办公用品,CN-2019-1973789,125
Cardinal 孔加固材料| 回收,4,中国,西南,内江,装订机,许安,2,四川,办公用品,CN-2019-1973789,32
Kleencut 开信刀| 工业,27,中国,华东,镇江,用品,宋良,4,江苏,办公用品,US-2019-3017568,321
KitchenAid 搅拌机| 黑色,550,中国,中南,汕头,器具,万兰,3,广东,办公用品,CN-2018-2975416,1376
柯尼卡 打印机| 红色,3784,中国,华东,景德镇,设备,俞明,9,江西,技术,CN-2017-4497736,11130
柯尼卡 打印机| 红色,3784,中国,华东,景德镇,设备,俞明,9,江西,技术,CN-2017-4497736,11130
柯尼卡 打印机| 红色,3784,中国,华东,景德镇,设备,俞明,9,江西,技术,CN-2017-4497736,11130
柯尼卡 打印机| 红色,3784,中国,华东,景德镇,设备,俞明,9,江西,技术,CN-2017-4497736,11130
柯尼卡 打印机| 红色,3784,中国,华东,景德镇,设备,俞明,9,江西,技术,CN-2017-4497736,11130
Ibico 订书机| 实惠,173,中国,华东,景德镇,装订机,俞明,2,江西,办公用品,CN-2017-4497736,480
Ibico 订书机| 实惠,173,中国,华东,景德镇,装订机,俞明,2,江西,办公用品,CN-2017-4497736,480
Ibico 订书机| 实惠,173,中国,华东,景德镇,装订机,俞明,2,江西,办公用品,CN-2017-4497736,480
Ibico 订书机| 实惠,173,中国,华东,景德镇,装订机,俞明,2,江西,办公用品,CN-2017-4497736,480
Ibico 订书机| 实惠,173,中国,华东,景德镇,装订机,俞明,2,江西,办公用品,CN-2017-4497736,480
SAFCO 扶手椅| 可调,2684,中国,华东,景德镇,椅子,俞明,4,江西,家具,CN-2017-4497736,8660
SAFCO 扶手椅| 可调,2684,中国,华东,景德镇,椅子,俞明,4,江西,家具,CN-2017-4497736,8660
SAFCO 扶手椅| 可调,2684,中国,华东,景德镇,椅子,俞明,4,江西,家具,CN-2017-4497736,8660
SAFCO 扶手椅| 可调,2684,中国,华东,景德镇,椅子,俞明,4,江西,家具,CN-2017-4497736,8660
SAFCO 扶手椅| 可调,2684,中国,华东,景德镇,椅子,俞明,4,江西,家具,CN-2017-4497736,8660
Green Bar 计划信息表| 多色,47,中国,华东,景德镇,纸张,俞明,5,江西,办公用品,CN-2017-4497736,588
Green Bar 计划信息表| 多色,47,中国,华东,景德镇,纸张,俞明,5,江西,办公用品,CN-2017-4497736,588
Green Bar 计划信息表| 多色,47,中国,华东,景德镇,纸张,俞明,5,江西,办公用品,CN-2017-4497736,588
Green Bar 计划信息表| 多色,47,中国,华东,景德镇,纸张,俞明,5,江西,办公用品,CN-2017-4497736,588
Green Bar 计划信息表| 多色,47,中国,华东,景德镇,纸张,俞明,5,江西,办公用品,CN-2017-4497736,588
Stockwell 橡皮筋| 整包,34,中国,华东,景德镇,系固件,俞明,2,江西,办公用品,CN-2017-4497736,154
Stockwell 橡皮筋| 整包,34,中国,华东,景德镇,系固件,俞明,2,江西,办公用品,CN-2017-4497736,154
Stockwell 橡皮筋| 整包,34,中国,华东,景德镇,系固件,俞明,2,江西,办公用品,CN-2017-4497736,154
Stockwell 橡皮筋| 整包,34,中国,华东,景德镇,系固件,俞明,2,江西,办公用品,CN-2017-4497736,154
Stockwell 橡皮筋| 整包,34,中国,华东,景德镇,系固件,俞明,2,江西,办公用品,CN-2017-4497736,154
爱普生 计算器| 耐用,4,中国,西北,榆林,设备,谢雯,2,陕西,技术,CN-2016-4195213,434
惠普 墨水| 红色,640,中国,东北,哈尔滨,复印机,康青,4,黑龙江,技术,CN-2019-5801711,2369
Jiffy 局间信封| 银色,89,中国,华东,青岛,信封,赵婵,3,山东,办公用品,CN-2017-2752724,684
SanDisk 键区| 可编程,344,中国,华东,青岛,配件,赵婵,5,山东,技术,CN-2017-2752724,1327
诺基亚 充电器| 蓝色,2849,中国,华东,青岛,电话,赵婵,2,山东,技术,CN-2017-2752724,5937
KitchenAid 冰箱| 黑色,3963,中国,华东,徐州,器具,刘斯云,7,江苏,办公用品,US-2018-2511714,10336
Novimex 圆形标签| 红色,38,中国,华东,徐州,标签,刘斯云,3,江苏,办公用品,US-2018-2511714,85
Memorex 键盘| 实惠,1071,中国,华东,上海,配件,白鹄,7,上海,技术,CN-2019-5631342,2330
Memorex 键盘| 实惠,1071,中国,华东,上海,配件,白鹄,7,上海,技术,CN-2019-5631342,2330
Avery 孔加固材料| 耐用,2,中国,华东,上海,装订机,白鹄,5,上海,办公用品,CN-2019-5631342,138
Avery 孔加固材料| 耐用,2,中国,华东,上海,装订机,白鹄,5,上海,办公用品,CN-2019-5631342,138

二、数据表准备

1.创建数据表

sql 复制代码
hive>create table supermarket(
Product_name string,
profit int,
country string,
region string,
city string,
Subcategory string,
Customer_name string,
number int,
province string,
category string,
order_id string,
sales_volume int
)row format delimited fields terminated by ',';

2.加载数据

sql 复制代码
hive>load data local inpath '/usr/local/src/datas/super.csv'into table supermarket;

三、需求

1.需求一

markdown 复制代码
  对于连锁商场来说,不同类型店铺的所带来的销售额也大不相同,例如大型综合超市的月销售额与同品牌定位在小区门口的社区便利店是不可而语的。但同时,大型综合超市的选址、占地、员工人数众多,相应的经营成本也很高。请以产品类型作为衡量维度,使用相关数据集求出各个产品所占百分比,结果保留两位小数。
sql 复制代码
hive>select category, concat(round(ratio,2), ' %')ratio from(select (count(*) over(partition by category)/count(*) over() )*100 as ratio,category from supermarket) re group by category,ratio;
markdown 复制代码
办公用品        69.03 %
家具    9.68 %
技术    21.29 %

2.需求二

markdown 复制代码
 公司计划在今年新增 25 家连锁门店,目标整体营业额全国销售突破 580 亿。由于不同地区因经济发展水平,居民消费能力等差异,所带来的商品销售情况也各不相同。请根据现有数据以地区为维度进行销售额汇总。
sql 复制代码
hive> select region,sum(sales_volume) from supermarket group by region;
mar 复制代码
东北    3049
中南    51873
华东    315426
华北    4014
西北    4412
西南    6546

3.需求三

markdown 复制代码
  销售数据分析工作涉及到销售成本分析、客户满意度分析、客户需求分析等。为了进行销售数据分析,需要对数据统计和分类,了解销售状态,并进一步做出决策。针对同一市场不同品牌产品的销售差异分析,可为企业的销售策略提供建议和参考;针对不同市场的同一品牌产品的销售差异分析, 可为企业的市场策略提供建议和参考;微观销售分析,可分析决定未能达到销售额的特定产品、地区等。销售分析可以决定一个商场的经营方向。请根据相关数据文件按照题目具体要求,分析商场销售数据。

3.1 求东北地区各个产品类别的销售量占东北地区总销售量的比率

分析语句:

markdown 复制代码
地区:东北   --where 过滤,只取东北地区
查询内容:category(产品类别)、ratio(比率) --比率要自己通过函数计算
比率计算:
		1.(sum(number) over(partition by category) --以产品类别作为分区计算出产品销售总量
		2. sum(number) over() --销售总量
		3. *100 --求百分比
		4. as ratio,region,category --地区产品类别的比率
		5. from supermarket --来自这张表
		6. where region='东北' -- 只要东北地区的,你也可以去搞其他地区的
		
汇总:
		1.concat(round(num,2),'%'):拼接字符串 --在统计结果后面加上%
		2.round(num,2):取小数点后两位
		3.re:比率计算数据集的别名
sql 复制代码
hive> select category,concat(round(num,2),'%')num from (select (sum(number) over(partition by category)/sum(number) over() )*100 as num,region,category from supermarket where  region='东北')re group by category,num;
markdown 复制代码
办公用品        76.47%
技术    23.53%

3.2 求各个地区的办公用品这个类别物品的销售量占总销售量的比率

sql 复制代码
hive>select region,category,concat(round(num,2), '%')num from (select (sum(number) over(partition by region)/sum(number) over() )*100 as num,region,category from supermarket where  category='办公用品')re group by region,category,num;
markdown 复制代码
东北    办公用品        2.9%
中南    办公用品        3.79%
华东    办公用品        84.15%
华北    办公用品        0.45%
西北    办公用品        4.91%
西南    办公用品        3.79%
相关推荐
lzhlizihang34 分钟前
【Hive sql 面试题】求出各类型专利top 10申请人,以及对应的专利申请数(难)
大数据·hive·sql·面试题
Hsu_kk35 分钟前
Hive 查询各类型专利 Top 10 申请人及对应的专利申请数
数据仓库·hive·hadoop
Tianyanxiao37 分钟前
如何利用探商宝精准营销,抓住行业机遇——以AI技术与大数据推动企业信息精准筛选
大数据·人工智能·科技·数据分析·深度优先·零售
静听山水38 分钟前
Hive 的数据存储单元结构
hive
大数据编程之光39 分钟前
Hive 查询各类型专利 top10 申请人及专利申请数
大数据·数据仓库·hive·hadoop
杰克逊的日记42 分钟前
Hive详解
数据仓库·hive·hadoop
上辈子杀猪这辈子学IT1 小时前
【Zookeeper集群搭建】安装zookeeper、zookeeper集群配置、zookeeper启动与关闭、zookeeper的shell命令操作
linux·hadoop·zookeeper·centos·debian
GDDGHS_1 小时前
大数据工具 flume 的安装配置与使用 (详细版)
大数据·flume
FIT2CLOUD飞致云2 小时前
仪表板展示|DataEase看中国:历年双十一电商销售数据分析
数据分析·开源·数据可视化·dataease·双十一
Acrelhuang2 小时前
安科瑞5G基站直流叠光监控系统-安科瑞黄安南
大数据·数据库·数据仓库·物联网