hive常用命令

可以直接从master节点访问数据

1. 访问数据

  1. 登录上master节点后切换到hadoop账号

    su hadoop

    sh 复制代码
    2. 访问hive
    直接输入hive可访问
    ```sh
    hive

2. 常见的命令

  1. 查看数据

    show databases;

  1. 切换数据库

    use saylo;

  1. 查看表

    show tables;

  1. 查看表结构

    desc t_big_prd_compress2_extract;

  1. 查询分区

    show partitions test_t_rec_scene_stats_10d;

  1. 查询内容

    select * from test_t_rec_scene_stats_10d limit 3;

  1. 查看建表语句

    show create table test_t_rec_scene_stats_10d;

  1. 删除表

    drop table if exists 表名;

  2. 清空表

    truncate table 表名;

4. 任务

所有的spark任务都是用crontab配置的,使用 crontab -l -u username 查看任务

复制代码
crontab -l -u root

crontab -e

5. 告警

告警面板;离线任务中每次执行完成,会发送一条 cls 日志;如果超过预定时长没有检测到日志则告警

告警面板链接

推荐离线moment静态表任务告警

6. 定时删除hive中数据

第一种方法: 设置表生命周期标识

alter table ${table_name} set tblproperties ('TABLE_LIFECYCLE'='365d');

第二种方法:定时任务删除:

shell 复制代码
END_DATE=$(date -d "$DEL_DATE +1 day" +"%Y-%m-%d")
HIVE_SQL="
ALTER TABLE $DATABASE.$TABLE
DROP PARTITION (datetime < '$END_DATE 00:00:00');
"

echo "【$(date '+%Y-%m-%d %H:%M:%S')】 正在删除 $DATABASE.$TABLE 中早于 $DEL_DATE 的分区..."
echo "【$(date '+%Y-%m-%d %H:%M:%S')】 执行 SQL: $HIVE_SQL"
相关推荐
橘子编程6 天前
Hive大数据实战指南:从入门到精通
大数据·hive·hadoop
橘子编程6 天前
Apache Hadoop知识全解析
大数据·hive·hadoop·apache
dovens6 天前
Spring Boot 从 2.7.x 升级到 3.3注意事项
数据库·hive·spring boot
Joy T8 天前
【大数据】离线数仓核心组件:Hive 架构解析与进阶操作指南
大数据·数据仓库·hive·hadoop·架构
jasnet_u8 天前
在Hadoop3.3.6上搭建Hive3.1.2
hive·hadoop
二进制_博客9 天前
使用Datax批量将mysql数据导入hive
数据库·hive·mysql
talen_hx2969 天前
《零基础入门Spark》学习笔记 Day 10
大数据·hive·笔记·学习·spark
二进制_博客9 天前
Spark On Hive 系统整合
大数据·hive·spark
蓝眸少年CY14 天前
Hive - 函数、压缩与优化
数据仓库·hive·hadoop
zhojiew16 天前
[INFRA] EMR集群中Hive和Spark集成Glue Data Catalog过程的深入分析
hive·hadoop·spark·aws·bigdata