hive修改表名、修改列名、修改分区

文章目录

官网地址:https://cwiki.apache.org/confluence/display/Hive/GettingStarted#GettingStarted-AlteringandDroppingTables

一、修改表

1、重命名表名

sql 复制代码
ALTER TABLE table_name RENAME TO new_table_name

示例: 将user表重命名为user_bak
alter table user rename to user_bak;

2、修改表TBLPROPERTIES属性:

sql 复制代码
ALTER TABLE table_name SET TBLPROPERTIES (property_name = property_value, property_name = property_value,... )


示例:
ALTER TABLE user SET TBLPROPERTIES ('tablename'= 'user表' )

说明:

  • SET TBLPROPERTIES中的属性若不存在则会新增进去;若已存在则会更改原先的值。如上述示例中的tablename属性,若不存在则新增此属性。

3、修改表注释

sql 复制代码
ALTER TABLE table_name SET TBLPROPERTIES('comment' = new_comment);

虽然看着是修改TBLPROPERTIES的属性,但是comment这个属性是表中的comment注释。

sql 复制代码
示例:将表注释'测试表'修改为'测试数据'
create table test(
	id string default null comment '编号'
)comment '测试表'
stored as hyperdrive;

ALTER TABLE test SET TBLPROPERTIES('comment' = '测试数据');

4、复制表结构

sql 复制代码
-- 创建一个相同表结构的表
create table new_table like table_name;

示例:创建user_bak使表结构与user表一致
create table user_bak like user;

5、拷贝表

sql 复制代码
-- 创建一个相同表结构的表,并把原先的数据复制到新表
CREATE TABLE new_table AS SELECT * FROM old_table

示例:
create table user_bak as select * from user;

6、删除表

sql 复制代码
drop table if exists table_name;

二、修改列

1、添加列

sql 复制代码
一次增加一个列(默认添加为最后一列)
ALTER TABLE table_name ADD COLUMNS (new_col INT); 
可以一次增加多个列
ALTER TABLE table_name ADD COLUMNS (c1 INT,c2 STRING); 
添加一列并增加列字段注释
ALTER TABLE table_name ADD COLUMNS (new_col INT COMMENT 'a comment');

注意:hive中添加列只会添加在最后,不支持插入到指定的位置。

2、修改列

修改列名、列类型、列位置

sql 复制代码
ALTER TABLE table_name CHANGE [COLUMN]
  col_old_name col_new_name column_type
    [COMMENT col_comment]
    [FIRST|AFTER column_name]
 
--- 示例:修改列名
CREATE TABLE test_change (a int, b int, c int);
ALTER TABLE test_change CHANGE a a1 INT; --将 a 列的名字改为 a1.
 
--将 a 列的名字改为 a1,a 列的数据类型改为 string,并将它放置在列 b 之后。新的表结构为: b int, a1 string, c int.
ALTER TABLE test_change CHANGE a a1 STRING AFTER b; 
 
--将 b 列的名字修改为 b1, 并将它放在第一列。新表的结构为: b1 int, a string, c int.
ALTER TABLE test_change CHANGE b b1 INT FIRST; 

该命令将允许用户更改列的名称、数据类型、注释、位置或它们的任意组合,但必须先存在该字段才能修改名字及指定位置.

列更改命令只修改Hive的元数据,不修改数据。用户应该确保表/分区的实际数据布局符合元数据定义。

3、删除列

sql 复制代码
原有Hive表test_change中有a,b,c,d,e这几个字段
将从test_change中删除"d"列:
ALTER TABLE test_change REPLACE COLUMNS (a int, b int,c string,e string);
将d和e两列一起删除:
ALTER TABLE test_change REPLACE COLUMNS (a int, b int,c string);

注意:如果列字段比较多,可以用show create table table_name; 显示建表语句,将字段一次性复制进来,删除哪些字段就直接去除即可.

三、修改分区

1、增加分区

sql 复制代码
--增加分区 语法
ALTER TABLE table_name ADD
  partition_spec [ LOCATION 'location1' ]
  partition_spec [ LOCATION 'location2' ] ...
 
partition_spec:
  : PARTITION (partition_col = partition_col_value,
        partition_col = partiton_col_value, ...)

--Add Partitions 语法案例:用户可以用 ALTER TABLE ADD PARTITION 来向一个表中增加分区。当分区名是字符串时加引号。
ALTER TABLE page_view ADD
    PARTITION (dt='2008-08-08', country='us')
      location '/path/to/us/part080808'
    PARTITION (dt='2008-08-09', country='us')
      location '/path/to/us/part080809';

2、修改分区

3、删除分区

sql 复制代码
---DROP PARTITION 删除分区
ALTER TABLE table_name DROP
    partition_spec, partition_spec,...
删除某分区数据

-- 删除dt = '2021-03-23'分区数据
SET mapred.output.compress = true;
SET hive.exec.compress.output = true;
SET mapred.job.priority = VERY_HIGH;
USE app;
ALTER TABLE table.table_name DROP partition(dt = '2021-03-23') ;

4、拷贝分区表

sql 复制代码
-- 拷贝同一结构
CREATE
	TABLE app.table_new LIKE app.table_old;
	
-- 拷贝分区表中的数据
set hive.exec.dynamic.partition=true;
set hive.exec.dynamic.partition.mode=nonstrict;
insert overwrite table app.table_new 
partition(dt, dt2)
select * from app.table_old;

5、查看分区结构

sql 复制代码
show partitions app.table_new

创作不易,欢迎打赏,你的鼓励将是我创作的最大动力。