超市零售案例
一、部分数据展示
markdown
Fiskars 剪刀| 蓝色,61,中国,华东,杭州,用品,曾惠,2,浙江,办公用品,US-2019-1357144,130
GlobeWeis 搭扣信封| 红色,43,中国,西南,内江,信封,许安,2,四川,办公用品,CN-2019-1973789,125
Cardinal 孔加固材料| 回收,4,中国,西南,内江,装订机,许安,2,四川,办公用品,CN-2019-1973789,32
Kleencut 开信刀| 工业,27,中国,华东,镇江,用品,宋良,4,江苏,办公用品,US-2019-3017568,321
KitchenAid 搅拌机| 黑色,550,中国,中南,汕头,器具,万兰,3,广东,办公用品,CN-2018-2975416,1376
柯尼卡 打印机| 红色,3784,中国,华东,景德镇,设备,俞明,9,江西,技术,CN-2017-4497736,11130
柯尼卡 打印机| 红色,3784,中国,华东,景德镇,设备,俞明,9,江西,技术,CN-2017-4497736,11130
柯尼卡 打印机| 红色,3784,中国,华东,景德镇,设备,俞明,9,江西,技术,CN-2017-4497736,11130
柯尼卡 打印机| 红色,3784,中国,华东,景德镇,设备,俞明,9,江西,技术,CN-2017-4497736,11130
柯尼卡 打印机| 红色,3784,中国,华东,景德镇,设备,俞明,9,江西,技术,CN-2017-4497736,11130
Ibico 订书机| 实惠,173,中国,华东,景德镇,装订机,俞明,2,江西,办公用品,CN-2017-4497736,480
Ibico 订书机| 实惠,173,中国,华东,景德镇,装订机,俞明,2,江西,办公用品,CN-2017-4497736,480
Ibico 订书机| 实惠,173,中国,华东,景德镇,装订机,俞明,2,江西,办公用品,CN-2017-4497736,480
Ibico 订书机| 实惠,173,中国,华东,景德镇,装订机,俞明,2,江西,办公用品,CN-2017-4497736,480
Ibico 订书机| 实惠,173,中国,华东,景德镇,装订机,俞明,2,江西,办公用品,CN-2017-4497736,480
SAFCO 扶手椅| 可调,2684,中国,华东,景德镇,椅子,俞明,4,江西,家具,CN-2017-4497736,8660
SAFCO 扶手椅| 可调,2684,中国,华东,景德镇,椅子,俞明,4,江西,家具,CN-2017-4497736,8660
SAFCO 扶手椅| 可调,2684,中国,华东,景德镇,椅子,俞明,4,江西,家具,CN-2017-4497736,8660
SAFCO 扶手椅| 可调,2684,中国,华东,景德镇,椅子,俞明,4,江西,家具,CN-2017-4497736,8660
SAFCO 扶手椅| 可调,2684,中国,华东,景德镇,椅子,俞明,4,江西,家具,CN-2017-4497736,8660
Green Bar 计划信息表| 多色,47,中国,华东,景德镇,纸张,俞明,5,江西,办公用品,CN-2017-4497736,588
Green Bar 计划信息表| 多色,47,中国,华东,景德镇,纸张,俞明,5,江西,办公用品,CN-2017-4497736,588
Green Bar 计划信息表| 多色,47,中国,华东,景德镇,纸张,俞明,5,江西,办公用品,CN-2017-4497736,588
Green Bar 计划信息表| 多色,47,中国,华东,景德镇,纸张,俞明,5,江西,办公用品,CN-2017-4497736,588
Green Bar 计划信息表| 多色,47,中国,华东,景德镇,纸张,俞明,5,江西,办公用品,CN-2017-4497736,588
Stockwell 橡皮筋| 整包,34,中国,华东,景德镇,系固件,俞明,2,江西,办公用品,CN-2017-4497736,154
Stockwell 橡皮筋| 整包,34,中国,华东,景德镇,系固件,俞明,2,江西,办公用品,CN-2017-4497736,154
Stockwell 橡皮筋| 整包,34,中国,华东,景德镇,系固件,俞明,2,江西,办公用品,CN-2017-4497736,154
Stockwell 橡皮筋| 整包,34,中国,华东,景德镇,系固件,俞明,2,江西,办公用品,CN-2017-4497736,154
Stockwell 橡皮筋| 整包,34,中国,华东,景德镇,系固件,俞明,2,江西,办公用品,CN-2017-4497736,154
爱普生 计算器| 耐用,4,中国,西北,榆林,设备,谢雯,2,陕西,技术,CN-2016-4195213,434
惠普 墨水| 红色,640,中国,东北,哈尔滨,复印机,康青,4,黑龙江,技术,CN-2019-5801711,2369
Jiffy 局间信封| 银色,89,中国,华东,青岛,信封,赵婵,3,山东,办公用品,CN-2017-2752724,684
SanDisk 键区| 可编程,344,中国,华东,青岛,配件,赵婵,5,山东,技术,CN-2017-2752724,1327
诺基亚 充电器| 蓝色,2849,中国,华东,青岛,电话,赵婵,2,山东,技术,CN-2017-2752724,5937
KitchenAid 冰箱| 黑色,3963,中国,华东,徐州,器具,刘斯云,7,江苏,办公用品,US-2018-2511714,10336
Novimex 圆形标签| 红色,38,中国,华东,徐州,标签,刘斯云,3,江苏,办公用品,US-2018-2511714,85
Memorex 键盘| 实惠,1071,中国,华东,上海,配件,白鹄,7,上海,技术,CN-2019-5631342,2330
Memorex 键盘| 实惠,1071,中国,华东,上海,配件,白鹄,7,上海,技术,CN-2019-5631342,2330
Avery 孔加固材料| 耐用,2,中国,华东,上海,装订机,白鹄,5,上海,办公用品,CN-2019-5631342,138
Avery 孔加固材料| 耐用,2,中国,华东,上海,装订机,白鹄,5,上海,办公用品,CN-2019-5631342,138
二、数据表准备
1.创建数据表
sql
hive>create table supermarket(
Product_name string,
profit int,
country string,
region string,
city string,
Subcategory string,
Customer_name string,
number int,
province string,
category string,
order_id string,
sales_volume int
)row format delimited fields terminated by ',';
2.加载数据
sql
hive>load data local inpath '/usr/local/src/datas/super.csv'into table supermarket;
三、需求
1.需求一
markdown
对于连锁商场来说,不同类型店铺的所带来的销售额也大不相同,例如大型综合超市的月销售额与同品牌定位在小区门口的社区便利店是不可而语的。但同时,大型综合超市的选址、占地、员工人数众多,相应的经营成本也很高。请以产品类型作为衡量维度,使用相关数据集求出各个产品所占百分比,结果保留两位小数。
sql
hive>select category, concat(round(ratio,2), ' %')ratio from(select (count(*) over(partition by category)/count(*) over() )*100 as ratio,category from supermarket) re group by category,ratio;
markdown
办公用品 69.03 %
家具 9.68 %
技术 21.29 %
2.需求二
markdown
公司计划在今年新增 25 家连锁门店,目标整体营业额全国销售突破 580 亿。由于不同地区因经济发展水平,居民消费能力等差异,所带来的商品销售情况也各不相同。请根据现有数据以地区为维度进行销售额汇总。
sql
hive> select region,sum(sales_volume) from supermarket group by region;
mar
东北 3049
中南 51873
华东 315426
华北 4014
西北 4412
西南 6546
3.需求三
markdown
销售数据分析工作涉及到销售成本分析、客户满意度分析、客户需求分析等。为了进行销售数据分析,需要对数据统计和分类,了解销售状态,并进一步做出决策。针对同一市场不同品牌产品的销售差异分析,可为企业的销售策略提供建议和参考;针对不同市场的同一品牌产品的销售差异分析, 可为企业的市场策略提供建议和参考;微观销售分析,可分析决定未能达到销售额的特定产品、地区等。销售分析可以决定一个商场的经营方向。请根据相关数据文件按照题目具体要求,分析商场销售数据。
3.1 求东北地区各个产品类别的销售量占东北地区总销售量的比率
分析语句:
markdown
地区:东北 --where 过滤,只取东北地区
查询内容:category(产品类别)、ratio(比率) --比率要自己通过函数计算
比率计算:
1.(sum(number) over(partition by category) --以产品类别作为分区计算出产品销售总量
2. sum(number) over() --销售总量
3. *100 --求百分比
4. as ratio,region,category --地区产品类别的比率
5. from supermarket --来自这张表
6. where region='东北' -- 只要东北地区的,你也可以去搞其他地区的
汇总:
1.concat(round(num,2),'%'):拼接字符串 --在统计结果后面加上%
2.round(num,2):取小数点后两位
3.re:比率计算数据集的别名
sql
hive> select category,concat(round(num,2),'%')num from (select (sum(number) over(partition by category)/sum(number) over() )*100 as num,region,category from supermarket where region='东北')re group by category,num;
markdown
办公用品 76.47%
技术 23.53%
3.2 求各个地区的办公用品这个类别物品的销售量占总销售量的比率
sql
hive>select region,category,concat(round(num,2), '%')num from (select (sum(number) over(partition by region)/sum(number) over() )*100 as num,region,category from supermarket where category='办公用品')re group by region,category,num;
markdown
东北 办公用品 2.9%
中南 办公用品 3.79%
华东 办公用品 84.15%
华北 办公用品 0.45%
西北 办公用品 4.91%
西南 办公用品 3.79%