hive:基本数据类型,关于表和列语法

基本数据类型

Hive 的数据类型分为基本数据类型和复杂数据类型

加粗的是常用数据类型
BOOLEAN出现ture和false外的其他值会变成NULL值
没有number,decimal类似number
如果输入的数据不符合数据类型, 映射时会变成NULL, 但是数据本身并没有被修改

创建表

创建表的本质其实就是在对应的数据库目录下面创建一个子目录,目录名为表名。数据文件就存在这个目录下。

使用语法1时需注意当前所在的数据库,判断是否需要切换数据库
工作中建议使用语法2
建表时未指定分隔符(语法1和语法2),Hive会使用默认的分隔符,列和列之间是\001,行与行之间是\n
row format delimited 开启分隔符格式化
分隔符可以自定义,比如逗号,\t制表符, 但是只能有单个分隔符
默认是以文本格式储存,所以 stored as textfile可写可不写

查看表


如果建表时没有指定分隔符,使用desc formatted tableName查看表结构时会出现SerDe Library行,
"SerDe Library" 行指的是用于序列化(Serializer)和反序列化(Deserializer)数据的库。在 Hive 中,SerDe 库负责将数据从一种格式转换为另一种格式,以便在查询和存储时使用。

如果建表时指定分隔符,使用desc formatted tableName查看表结构时会展示分隔符

删除表

修改表名


colType是数据类型;

修改列

  • 修改列的位置 : 注意, 2 .x 版本后,必须是相同类型进行移动位置。
    alter table tableName change column colName colName colType after colName1;
    alter table t1 change column english english int after chinese;
    alter table tableName change column colName colName colType first ;

将字段放在首位,前提是要移动的字段和第一个字段的数据类型要保持一致;


注意:修改,增加,删除字段等只是改变字段和数据的映射关系,表内的数据并没有改变

相关推荐
技术与健康5 小时前
LLM实践系列:利用LLM重构数据科学流程03- LLM驱动的数据探索与清洗
大数据·人工智能·重构
TDengine (老段)6 小时前
TDengine IDMP 应用场景:工业锅炉监控
大数据·数据库·物联网·信息可视化·时序数据库·tdengine
软件开发明哥7 小时前
BigData大数据应用开发学习笔记(06)实时检索--HBase
大数据
杨荧8 小时前
基于Python的农作物病虫害防治网站 Python+Django+Vue.js
大数据·前端·vue.js·爬虫·python
卖寂寞的小男孩11 小时前
spark数据缓存机制
大数据·缓存·spark
jiedaodezhuti11 小时前
Flink直接缓冲存储器异常解析与解决方案
大数据·flink
代码的余温12 小时前
Elasticsearch Master选举机制解析
大数据·elasticsearch·搜索引擎
计算机源码社13 小时前
计算机毕设选题推荐 基于Spark的家庭能源消耗智能分析与可视化系统 基于机器学习的家庭能源消耗预测与可视化系统源码
大数据·机器学习·数据分析·spark·毕业设计·课程设计·毕业设计源码
myself13 小时前
Hadoop中的MapReduce学习 - Mapper和shuffle阶段
hadoop
IT研究室13 小时前
大数据毕业设计选题推荐-基于大数据的北京市医保药品数据分析系统-Spark-Hadoop-Bigdata
大数据·hadoop·spark·毕业设计·源码·数据可视化