7.1 Hive内置函数

文章目录

  • [1. 内置函数概述](#1. 内置函数概述)
  • [2. 函数查看与描述](#2. 函数查看与描述)
  • [3. 熟悉Hive运算](#3. 熟悉Hive运算)
  • [4. 常用内置函数](#4. 常用内置函数)
    • [4.1 数学函数](#4.1 数学函数)
    • [4.2 日期函数](#4.2 日期函数)
    • [4.3 条件函数](#4.3 条件函数)
    • [4.4 汇聚去重函数](#4.4 汇聚去重函数)
      • [4.4.1 单列数据去重](#4.4.1 单列数据去重)
      • [4.4.2 分组数据去重](#4.4.2 分组数据去重)
    • [4.5 汇聚不去重函数](#4.5 汇聚不去重函数)
    • [4.6 字符串函数](#4.6 字符串函数)
      • [4.6.1 字符串函数(上)](#4.6.1 字符串函数(上))
      • [4.6.2 字符串函数(下)](#4.6.2 字符串函数(下))
    • [4.7 集合统计函数](#4.7 集合统计函数)
  • [5. 实战总结](#5. 实战总结)

1. 内置函数概述

  • Hive 内置函数丰富,涵盖数学(如 roundlog)、字符串(如 substrconcat)、日期(如 from_unixtimedatediff)、集合(如 sizemap_keys)及条件函数(如 casecoalesce)等类别,支持对表中数据进行高效转换与计算。所有函数可在 SELECT 语句中直接调用,极大简化 ETL 与分析逻辑,提升开发效率。

2. 函数查看与描述

3. 熟悉Hive运算

4. 常用内置函数

4.1 数学函数

4.2 日期函数

4.3 条件函数

4.4 汇聚去重函数

4.4.1 单列数据去重

4.4.2 分组数据去重

4.5 汇聚不去重函数

4.6 字符串函数

4.6.1 字符串函数(上)

4.6.2 字符串函数(下)

4.7 集合统计函数

5. 实战总结

  • 本次 Hive 内置函数实战全面覆盖数学、日期、字符串、条件、聚合及集合统计等类别,通过大量示例验证了函数在数据清洗、转换、分析中的强大能力。重点掌握了 collect_setcollect_list 在去重与保留重复场景下的差异应用,熟练运用 regexp_replaceparse_urlget_json_object 等函数处理非结构化数据,并通过 percentilevar_pop 等实现统计分析。整体提升了在 Hive 中高效编写 ETL 逻辑与复杂查询的能力,为大数据处理奠定坚实基础。
相关推荐
白日与明月2 小时前
Hive子查询中的ORDER BY陷阱:为什么排序“消失”了?
数据仓库·hive·hadoop
Nefu_lyh1 天前
【Hive】六、Hive 运算逻辑:数学 / 逻辑 / 条件 / 日期 / 字符串函数
数据仓库·hive·hadoop
AQin10122 天前
【对比向】既生瑜何生亮?不!Hive 和 Doris不一样
数据仓库·hive·hadoop·doris
AQin10122 天前
【对比向】细算“成本”——Hive vs. Doris
大数据·数据库·hive·doris·实时数仓
青春万岁!!3 天前
hive分区表加字段后insert字段为空
数据仓库·hive·hadoop
Nefu_lyh5 天前
【Hive】三、Hive 抽样:讲解 Hive 三大抽样方式:分桶抽样、块抽样、随机抽样的原理、语法、性能对比与实战案例
数据仓库·hive·hadoop
迈巴赫车主6 天前
Hive中分组聚合导致的数据倾斜优化
数据仓库·hive·hadoop
Leo.yuan7 天前
MySQL到Hive数据同步怎么选工具?FineDataLink全链路方案实测
数据库·hive·mysql
Nefu_lyh7 天前
【Hive】02 Hive 分区与分桶:深入理解 Hive 分区与分桶的原理、执行过程、Bucket Map Join、SMB Join 以及最佳实践
数据仓库·hive·hadoop
Nefu_lyh7 天前
【Hive】一、Hive数据类型:基本数据类型、复杂数据类型
数据仓库·hive·hadoop