【Hive】学习路线:架构、运维、Hsql实战、源码分析

文章目录

  • [一. Hive 基础学习](#一. Hive 基础学习)
    • [1. 基础知识](#1. 基础知识)
    • [2. 安装与配置](#2. 安装与配置)
    • [3. 数据存储与表结构](#3. 数据存储与表结构)
  • [二. hive运维](#二. hive运维)
  • [三. Hive实战](#三. Hive实战)
    • [1. Hive SQL 基础](#1. Hive SQL 基础)
    • [2. 高级查询与数据分析](#2. 高级查询与数据分析)
    • [3. 数据存储优化](#3. 数据存储优化)
    • [4. 性能调优](#4. 性能调优)
  • [四. Hive源码分析](#四. Hive源码分析)

一. Hive 基础学习

1. 基础知识

hive简介

架构说明

【hive-design】hive架构详解:描述了hive架构,hive主要组件的作用、hsql在hive执行过程中的底层细节、hive各组件作用

2. 安装与配置

  • 在本地或服务器上安装 Hive,了解不同的安装方式和配置参数。
  • 配置 Hive 的元数据存储(通常是 MySQL 等关系型数据库)。

【hive】Install hive using mysql as hive metadata service

3. 数据存储与表结构

  • 理解 Hive 数据存储在 HDFS 上的方式,以及不同的存储格式(如 TEXT、ORC、PARQUET 等)的特点。
  • 学习如何创建表、定义列、设置数据类型、添加分区和分桶等。
  • 基本、集合数据类型、文本文件数据编码、读时模式。

【002hive基础】hive的库、表与hdfs的组织逻辑

【003hive基础】hive的数据类型

【004hive基础】hive的文件存储格式与压缩

二. hive运维

hive CUSTOM authentication mode:通过用户名密码连接hiveserver

【hive 运维】hive注释/数据支持中文

【运维】hive 高可用详解: Hive MetaStore HA、hive server HA原理详解;hive高可用实现

【Hive-权限】HiveAccessControlException Permission denied: CREATEFUNCTION

【运维】hive 终端突然不能使用:Hive Schema version does not match metastore's schema version

三. Hive实战

1. Hive SQL 基础

  • 数据定义DDL:创建外部表、内部表、分区表
  • 掌握 Hive 的 SQL 语法,包括数据查询(SELECT)、数据插入(INSERT)、数据更新(UPDATE)、数据删除(DELETE)等操作。
  • 熟悉 Hive 的函数和操作符,如聚合函数、字符串函数、日期函数等。
  • UDF的创建

2. 高级查询与数据分析

  • 学习使用窗口函数进行复杂的数据分析,如排名、累计求和等。
  • 掌握子查询和视图的使用,提高 SQL 的可读性和可维护性。
  • 了解如何进行表连接操作,包括内连接、外连接、左连接、右连接等。

3. 数据存储优化

  • 比较不同存储格式的性能和特点,选择适合特定场景的存储格式。
  • 学习如何对数据进行压缩,提高存储效率和查询性能。
  • 掌握动态分区和静态分区的使用,优化数据存储和查询。

4. 性能调优

  • 了解 Hive 的执行引擎(如 MapReduce、Tez、Spark),选择合适的执行引擎以提高性能。
  • 优化 Hive SQL 语句,避免性能瓶颈,如减少数据量、合理使用索引等。
  • 调整 Hive 的配置参数,如内存设置、并行度设置等,以优化性能。

四. Hive源码分析

Hive metastore整体代码分析及详解

Hive metastore源码分析

Hive架构与源码分析(整理版)

Hive架构之HiveServer2(14)

相关推荐
莫非王土也非王臣6 小时前
深度学习之对比学习
人工智能·深度学习·学习
Wzx1980126 小时前
doker深学习
学习·docker
InterestOriented7 小时前
破解银发学习痛点 兴趣岛 “普惠 + 品质” 模式打造积极老龄化范本
大数据·人工智能·学习
HyperAI超神经7 小时前
IQuest-Coder-V1:基于代码流训练的编程逻辑增强模型;Human Face Emotions:基于多标注维度的人脸情绪识别数据集
人工智能·深度学习·学习·机器学习·ai编程
testpassportcn8 小时前
UiPath-ADPV1 認證介紹|Automation Developer Professional v1
网络·学习·改行学it
生擒小朵拉8 小时前
ROS1学习笔记(二)
笔记·学习
梦梦代码精8 小时前
BuildingAI vs Dify vs 扣子:三大开源智能体平台架构风格对比
开发语言·前端·数据库·后端·架构·开源·推荐算法
小程故事多_809 小时前
AI Agent进阶架构:用渐进式披露驯服复杂性
人工智能·架构
百***78759 小时前
Grok-4.1技术深度解析:双版本架构突破与Python API快速集成指南
大数据·python·架构
Gorgous—l10 小时前
数据结构算法学习:LeetCode热题100-动态规划篇(下)(单词拆分、最长递增子序列、乘积最大子数组、分割等和子集、最长有效括号)
数据结构·学习·算法