hive

IT成长日记2 小时前
hive·sql·spark·混合计算
【Hive入门】Hive与Spark SQL集成:混合计算实践指南目录引言1 Hive与Spark SQL概述1.1 Hive简介1.2 Spark SQL简介2 Hive与Spark SQL集成架构
IT成长日记4 小时前
hive·sql·spark·catalog·metastore
【Hive入门】Hive与Spark SQL深度集成:Metastore与Catalog兼容性全景解析目录引言1 元数据管理体系架构对比1.1 Hive Metastore架构解析1.2 Spark Catalog系统设计
£菜鸟也有梦5 小时前
大数据·数据仓库·hive·hadoop
Hive进阶之路目录一、Hive 基础回顾二、数据定义语言(DDL)进阶2.1 复杂表创建2.2 分区与分桶优化三、数据操作语言(DML)深入
Microsoft Word5 小时前
hive·hadoop·servlet
Servlet静态资源动态资源生活举例Servlet (server applet) 是运行在服务端(tomcat)的Java小程序,是sun公司提供一套定义动态资源规范; 从代码层面上来讲Servlet就是一个接口
IT成长日记8 小时前
hive·sql·spark·性能分析·spark sql·执行引擎
【Hive入门】Hive与Spark SQL深度集成:执行引擎性能全面对比与调优分析目录引言1 Hive执行引擎架构演进1.1 Hive执行引擎发展历程1.2 执行引擎架构对比1.2.1 MapReduce引擎架构
IT成长日记1 天前
hive·sql·spark
【Hive入门】Hive与Spark SQL深度集成:通过Spark ThriftServer高效查询Hive表目录引言1 Spark ThriftServer架构解析1.1 核心组件与工作原理1.2 与传统HiveServer2的对比
IT成长日记1 天前
数据仓库·hive·hadoop·资源配置
【Hive入门】Hive性能调优之资源配置:深入解析执行引擎参数调优目录前言1 Hive执行引擎概述2 MapReduce引擎调优2.1 Map阶段资源配置2.2 Reduce阶段资源配置
IT成长日记2 天前
数据仓库·hive·hadoop·join优化·mapjoin·sort-merge join
【Hive入门】Hive性能调优之Join优化:深入解析MapJoin与Sort-Merge Join策略目录前言1 Hive Join操作基础1.1 Join操作的类型与挑战1.2 Hive Join执行机制
IT成长日记2 天前
数据仓库·hive·hadoop·视图与物化视图
【Hive入门】Hive高级特性:视图与物化视图特性视图(View)物化视图(Materialized View)数据存储不存储数据,动态执行查询存储查询结果,直接读取数据
IT成长日记2 天前
数据仓库·hive·hadoop·动态分区·小文件问题
【Hive入门】Hive性能调优:小文件问题与动态分区合并策略详解目录引言1 Hive小文件问题概述1.1 什么是小文件问题1.2 小文件产生的原因2 Hive小文件合并机制
IT成长日记3 天前
数据仓库·hive·hadoop·事务·acid
【Hive入门】Hive高级特性:事务表与ACID特性详解目录1 Hive事务概述2 ACID特性详解3 Hive事务表的配置与启用3.1 启用Hive事务支持
wangzhongyudie3 天前
数据库·hive·sql
SQL实战:04之SQL中的分组问题求解最近刷题时遇到一些比较有意思的题目,乍一遇上时还不知道怎么求解,在灵光一闪时找到了问题的求解答案,感觉还比较有意思。题目虽然不是很难,但是要解答出来还是需要有一点思维的转弯,为了加深记忆,就选取了一道记录下来。
专注于大数据技术栈3 天前
hive·hadoop·python·excel
pyspark将hive数据写入Excel文件中不多解释直接上代码,少python包的自己直接下载创作不易,觉得还不错,辛苦给个点赞👍🏻,感谢~~
多多*4 天前
数据库·数据仓库·hive·hadoop·sql·mysql·mybatis
SQL语句练习 自学SQL网 多表查询目录Day 6 用JOINs进行多表联合查询Day 7 外连接 OUTER JOINsDay 8 外连接 特殊关键字 NULLs
IT成长日记4 天前
hive·hadoop·性能优化·explain·执行计划分析
【Hive入门】Hive性能优化:执行计划分析EXPLAIN命令的使用目录1 EXPLAIN命令简介1.1 什么是EXPLAIN命令?1.2 EXPLAIN命令的语法2 解读执行计划中的MapReduce阶段
wangzhongyudie5 天前
数据库·hive·sql
SQL实战:03之SQL中的递归查询最近刷题时遇到了一道需要根据组织层级来统计各个层级的一些数据,当时碰到时的第一想法就是需要使用递归来实现。但是以前在SQl中从来就没有用过递归查询,后面到网上一搜索,居然还真有递归查询的实现,也算是给自己扫了一下盲了。
IT成长日记5 天前
数据仓库·hive·hadoop·udf
【Hive入门】Hive函数:内置函数与UDF开发
viperrrrrrrrrr75 天前
大数据·hive·学习·impala
大数据学习(115)-hive与impala🍋🍋大数据学习🍋🍋🔥系列专栏: 👑哲学语录: 用力所能及,改变世界。 💖如果觉得博主的文章还不错的话,请点赞👍+收藏⭐️+留言📝支持一下博主哦🤞
IT成长日记6 天前
数据仓库·hive·hadoop·hive分区·hive分区表
【Hive入门】Hive分区与分区表完全指南:从原理到企业级实践特性分区分桶组织方式按列值划分目录按哈希值划分文件适用场景高基数列低基数列文件数量与分区数成正比固定桶数
youka1507 天前
大数据·hive·学习
大数据学习栈记——Hive4.0.1安装本文介绍大数据技术中数据仓库Hive的安装配置,版本:Hive4.0.1,Ubuntu24.04。Hive由 Facebook 开源用于解决海量结构化日志的数据统计工具。