7.1 Hive内置函数

文章目录

  • [1. 内置函数概述](#1. 内置函数概述)
  • [2. 函数查看与描述](#2. 函数查看与描述)
  • [3. 熟悉Hive运算](#3. 熟悉Hive运算)
  • [4. 常用内置函数](#4. 常用内置函数)
    • [4.1 数学函数](#4.1 数学函数)
    • [4.2 日期函数](#4.2 日期函数)
    • [4.3 条件函数](#4.3 条件函数)
    • [4.4 汇聚去重函数](#4.4 汇聚去重函数)
      • [4.4.1 单列数据去重](#4.4.1 单列数据去重)
      • [4.4.2 分组数据去重](#4.4.2 分组数据去重)
    • [4.5 汇聚不去重函数](#4.5 汇聚不去重函数)
    • [4.6 字符串函数](#4.6 字符串函数)
      • [4.6.1 字符串函数(上)](#4.6.1 字符串函数(上))
      • [4.6.2 字符串函数(下)](#4.6.2 字符串函数(下))
    • [4.7 集合统计函数](#4.7 集合统计函数)
  • [5. 实战总结](#5. 实战总结)

1. 内置函数概述

  • Hive 内置函数丰富,涵盖数学(如 roundlog)、字符串(如 substrconcat)、日期(如 from_unixtimedatediff)、集合(如 sizemap_keys)及条件函数(如 casecoalesce)等类别,支持对表中数据进行高效转换与计算。所有函数可在 SELECT 语句中直接调用,极大简化 ETL 与分析逻辑,提升开发效率。

2. 函数查看与描述

3. 熟悉Hive运算

4. 常用内置函数

4.1 数学函数

4.2 日期函数

4.3 条件函数

4.4 汇聚去重函数

4.4.1 单列数据去重

4.4.2 分组数据去重

4.5 汇聚不去重函数

4.6 字符串函数

4.6.1 字符串函数(上)

4.6.2 字符串函数(下)

4.7 集合统计函数

5. 实战总结

  • 本次 Hive 内置函数实战全面覆盖数学、日期、字符串、条件、聚合及集合统计等类别,通过大量示例验证了函数在数据清洗、转换、分析中的强大能力。重点掌握了 collect_setcollect_list 在去重与保留重复场景下的差异应用,熟练运用 regexp_replaceparse_urlget_json_object 等函数处理非结构化数据,并通过 percentilevar_pop 等实现统计分析。整体提升了在 Hive 中高效编写 ETL 逻辑与复杂查询的能力,为大数据处理奠定坚实基础。
相关推荐
Gain_chance3 小时前
34-学习笔记尚硅谷数仓搭建-DWS层最近一日汇总表建表语句汇总
数据仓库·hive·笔记·学习·datagrip
Gain_chance5 小时前
35-学习笔记尚硅谷数仓搭建-DWS层最近n日汇总表及历史至今汇总表建表语句
数据库·数据仓库·hive·笔记·学习
无级程序员14 小时前
大数据Hive之拉链表增量取数合并设计(主表加历史表合并成拉链表)
大数据·hive·hadoop
华农DrLai16 小时前
Spark SQL Catalyst 优化器详解
大数据·hive·sql·flink·spark
十月南城1 天前
Hive与离线数仓方法论——分层建模、分区与桶的取舍与查询代价
数据仓库·hive·hadoop
鹏说大数据1 天前
Spark 和 Hive 的关系与区别
大数据·hive·spark
B站计算机毕业设计超人1 天前
计算机毕业设计Hadoop+Spark+Hive招聘推荐系统 招聘大数据分析 大数据毕业设计(源码+文档+PPT+ 讲解)
大数据·hive·hadoop·python·spark·毕业设计·课程设计
B站计算机毕业设计超人1 天前
计算机毕业设计hadoop+spark+hive交通拥堵预测 交通流量预测 智慧城市交通大数据 交通客流量分析(源码+LW文档+PPT+讲解视频)
大数据·hive·hadoop·python·spark·毕业设计·课程设计
AI架构师小马1 天前
Hive调优手册:从入门到精通的完整指南
数据仓库·hive·hadoop·ai
数据架构师的AI之路1 天前
深入了解大数据领域Hive的HQL语言特性
大数据·hive·hadoop·ai