hive:基本数据类型,关于表和列语法

基本数据类型

Hive 的数据类型分为基本数据类型和复杂数据类型

加粗的是常用数据类型
BOOLEAN出现ture和false外的其他值会变成NULL值
没有number,decimal类似number
如果输入的数据不符合数据类型, 映射时会变成NULL, 但是数据本身并没有被修改

创建表

创建表的本质其实就是在对应的数据库目录下面创建一个子目录,目录名为表名。数据文件就存在这个目录下。

使用语法1时需注意当前所在的数据库,判断是否需要切换数据库
工作中建议使用语法2
建表时未指定分隔符(语法1和语法2),Hive会使用默认的分隔符,列和列之间是\001,行与行之间是\n
row format delimited 开启分隔符格式化
分隔符可以自定义,比如逗号,\t制表符, 但是只能有单个分隔符
默认是以文本格式储存,所以 stored as textfile可写可不写

查看表


如果建表时没有指定分隔符,使用desc formatted tableName查看表结构时会出现SerDe Library行,
"SerDe Library" 行指的是用于序列化(Serializer)和反序列化(Deserializer)数据的库。在 Hive 中,SerDe 库负责将数据从一种格式转换为另一种格式,以便在查询和存储时使用。

如果建表时指定分隔符,使用desc formatted tableName查看表结构时会展示分隔符

删除表

修改表名


colType是数据类型;

修改列

  • 修改列的位置 : 注意, 2 .x 版本后,必须是相同类型进行移动位置。
    alter table tableName change column colName colName colType after colName1;
    alter table t1 change column english english int after chinese;
    alter table tableName change column colName colName colType first ;

将字段放在首位,前提是要移动的字段和第一个字段的数据类型要保持一致;


注意:修改,增加,删除字段等只是改变字段和数据的映射关系,表内的数据并没有改变

相关推荐
字节跳动数据平台11 小时前
代码量减少 70%、GPU 利用率达 95%:火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
得物技术13 小时前
深入剖析Spark UI界面:参数与界面详解|得物技术
大数据·后端·spark
武子康14 小时前
大数据-238 离线数仓 - 广告业务 Hive分析实战:ADS 点击率、购买率与 Top100 排名避坑
大数据·后端·apache hive
武子康1 天前
大数据-237 离线数仓 - Hive 广告业务实战:ODS→DWD 事件解析、广告明细与转化分析落地
大数据·后端·apache hive
大大大大晴天2 天前
Flink生产问题排障-Kryo serializer scala extensions are not available
大数据·flink
武子康4 天前
大数据-236 离线数仓 - 会员指标验证、DataX 导出与广告业务 ODS/DWD/ADS 全流程
大数据·后端·apache hive
武子康5 天前
大数据-235 离线数仓 - 实战:Flume+HDFS+Hive 搭建 ODS/DWD/DWS/ADS 会员分析链路
大数据·后端·apache hive
DianSan_ERP5 天前
电商API接口全链路监控:构建坚不可摧的线上运维防线
大数据·运维·网络·人工智能·git·servlet
够快云库5 天前
能源行业非结构化数据治理实战:从数据沼泽到智能资产
大数据·人工智能·机器学习·企业文件安全
AI周红伟5 天前
周红伟:智能体全栈构建实操:OpenClaw部署+Agent Skills+Seedance+RAG从入门到实战
大数据·人工智能·大模型·智能体