Hive电商分析项目 Azkaban自动化运行

1. 清空HDFS上所有的文件

bash 复制代码
hdfs dfs -rm -R /user
hdfs dfs -rm -R /tmp
hdfs dfs -rm -R /origin_data

2.移除掉duoduo_baobiao这个database

然后把duoduo_baobiao 这个database里面的所有的表都建立好

sql 复制代码
Drop database duoduo_baobiao;
CREATE DATABASE duoduo_baobiao;
USE duoduo_baobiao;

#每月商品行为表
DROP TABLE IF EXISTS ads_sku_sales_top10; 
CREATE TABLE ads_sku_sales_top10
(
sku_id VARCHAR(255) COMMENT 'sku_id', 
favour_cnts BIGINT COMMENT '收藏次数',
cart_cnts BIGINT COMMENT '加购物车次数',
order_cnts BIGINT COMMENT '下单次数',
pay_cnts BIGINT COMMENT '支付次数'
) 
COMMENT '每月商品行为表' ;

#每月商品分类销量排行表
DROP TABLE IF EXISTS ads_sales_category_top_top10;
CREATE  TABLE ads_sales_category_top_top10
(
category3_name VARCHAR(255) COMMENT '三级分类名称',
cat_num  BIGINT   COMMENT  '分类商品销量'
)
COMMENT '每月商品分类销量排行表';

#每月商品品牌销售排行表
DROP TABLE IF EXISTS ads_sku_num_trademark_top10;
CREATE  TABLE ads_sku_num_trademark_top10
(tm_name VARCHAR(255) COMMENT '品牌名称',
total_num BIGINT COMMENT '销售数量'
)COMMENT '每月商品品牌销售排行表';

#每月省市下单金额排行表
DROP TABLE IF EXISTS ads_sku_amount_province_top10;
CREATE  TABLE ads_sku_amount_province_top10
(province_name VARCHAR(255) COMMENT '省市名称',
total_amount DECIMAL(16,2) COMMENT '下单金额'
)COMMENT '每月省市下单金额排行表';

#每月省市支付金额排行表
DROP TABLE IF EXISTS ads_sku_payamount_province_top10;
CREATE  TABLE ads_sku_payamount_province_top10
(province_name VARCHAR(255) COMMENT '省市名称',
total_payamount DECIMAL(16,2) COMMENT '支付金额'
)COMMENT '每月省市支付金额排行表';

#每月用户支付金额排行表
DROP TABLE IF EXISTS ads_user_payamount_top10;
CREATE  TABLE ads_user_payamount_top10
(user_name VARCHAR(255) COMMENT '用户名称',
total_payamount DECIMAL(16,2) COMMENT '下单金额'
)COMMENT '每月用户支付金额排行表';


#每月用户下单金额排行榜
DROP TABLE IF EXISTS ads_user_order_amount_top10; 
CREATE  TABLE ads_user_order_amount_top10
(
user_name VARCHAR(255) COMMENT '用户名', 
order_amount DECIMAL(20,2) COMMENT '下单金额' 
) 
COMMENT '每月用户下单金额排行榜' ;

#每月商品差评排行榜
DROP TABLE IF EXISTS ads_sku_badcomment_top10;
CREATE  TABLE ads_sku_badcomment_top10
(sku_name VARCHAR(255) COMMENT '商品sku名称',
 bad_cnt BIGINT COMMENT '差评数量'
)COMMENT '每月商品差评排行榜';

#每月商品好评排行榜
DROP TABLE IF EXISTS ads_sku_goodcomment_top10;
CREATE  TABLE ads_sku_goodcomment_top10
(sku_name VARCHAR(255) COMMENT '商品sku名称',
 good_cnt BIGINT COMMENT '好评数量'
)COMMENT '每月商品好评排行榜';

#每月用户给差评排行榜
DROP TABLE IF EXISTS ads_user_badcomment_top10;
CREATE  TABLE ads_user_badcomment_top10
(user_name VARCHAR(255) COMMENT '用户名称',
 bad_cnt BIGINT COMMENT '差评数量'
)COMMENT '每月用户给差评排行榜';

3.九个sh文件传到/duoduo文件夹中

4.赋予九个sh文件可执行权限

bash 复制代码
chmod 777 ./*sh

5.job文件构建

bash 复制代码
#step1.job
type=command
command=/duoduo/mysql_to_hdfs.sh first ${dt}

#step2.job
type=command
command=/duoduo/create.sh

#step3.job
type=command
dependencies=step1,step2
command=/duoduo/ods.sh first ${dt}

#step4.job
type=command
dependencies=step3
command=/duoduo/dwd.sh

#step5.job
type=command
dependencies=step4
command=/duoduo/ods_to_dwd.sh first ${dt}

#step6.job
type=command
dependencies=step5
command=/duoduo/dws.sh ${dt}

#step7.job
type=command
dependencies=step6
command=/duoduo/dwt.sh ${dt}

#step8.job
type=command
dependencies=step7
command=/duoduo/ads.sh

#step9.job
type=command
dependencies=step8
command=/duoduo/ads_to_mysql.sh

6.输入参数,运行脚本

输入的参数 dt 的值 2025-08-11 必须加单引号 '2025-08-11'

相关推荐
Teacher.chenchong2 小时前
AI-Agent2.0 科研全链路实战营:LLM+NotebookLM + 自动化编程 + 文献管理 + 论文写作,搭建本地科研智能体
人工智能·自动化
Maydaycxc3 小时前
Codex 配置到落地:从 API 接入到自动化RPA工作流实战
自动化·ai编程·rpa
不大姐姐AI智能体3 小时前
实测教程:用 Codex 配合 HyperFrames,把公众号文章做成可渲染的讲解型视频
人工智能·经验分享·gpt·自动化·aigc
2601_956414144 小时前
迈向智慧实验室:金现代的全链路质量管控与自动化解决方案
运维·自动化
ShGamu6 小时前
自动化输送设备公司选型参考与核心维度梳理
运维·自动化·自动化输送设备
一晌小贪欢6 小时前
第26节:自动化办公——利用 Python 自动生成动态分析报告 (PPT/PDF)
开发语言·python·数据分析·自动化·powerpoint·pandas·数据可视化
王小王-1237 小时前
基于商品评价的评论情感分析与可视化系统
hive·情感分析·商品评价分析·主题分析·商品评论分析
Black蜡笔小新7 小时前
自动化AI算法训练服务器DLTM一体化训推平台构建企业专属AI能力中台
人工智能·算法·自动化
Mr -老鬼8 小时前
EasyClick 脚本开发,选哪个 AI 工具最靠谱?
人工智能·自动化·ai编程·easyclick
Rain5099 小时前
1.1 理解AI Agent与自动化数据分析
人工智能·ai·数据分析·自动化·ai编程