hive

William一直在路上18 小时前
hive·spring boot·后端
SpringBoot 拦截器和过滤器的区别SpringBoot 中的拦截器(Interceptor)和过滤器(Filter)都是用于请求处理的增强机制,但它们存在以下核心区别:
抛砖者1 天前
hive·sql·spark
hive/spark sql中unix_timestamp 函数的坑以及时间戳相关的转换我用的是hive版本是3.1.3,spark版本是3.3.1,它们的unix_timestamp 函数在同样的语句下转换出来的时间戳是完全不同的,如下试验所示
无级程序员7 天前
hive·hadoop·hdfs
hive2服务启动报错:/tmp/hive on HDFS should be writable(不是chmod 777能解决的)启动报错如下:网上一大堆说是把hdfs上的/tmp权限改成777,如果真是这么简单,那按提示修改权限就是了,但实际查看/tmp的权限没问题,/tmp/hive的权限也没问题,如下图: 这个问题卡了我大半天,后来才猜想应该是/user/hive的权限问题导致的,直接删除/user/hive,重建后,把/user/hive的owner改为hive,重新启动就好了:
rui锐rui7 天前
大数据·hive·学习
大数据学习2:HIve文件夹之前都创建过,就是切换到/opt/tools目录上传两个包,apache-hive-3.1.2-bin.tar.gz与mysql-5.7.34-1.el7.x86_64.rpm-bundle.tar
凌辰揽月7 天前
hive·学习·servlet
Servlet学习:::warning 1、Servlet 是 JavaEE 规范之一。规范就是接口2、Servlet 就 JavaWeb 三大组件之一。三大组件分别是:Servlet 程序、Filter 过滤器、Listener 监听器。
weixin_307779138 天前
大数据·linux·hive·bash·迁移学习
Hive集群之间迁移的Linux Shell脚本migrate_hive_single_table.shmigrate_hive_all.sh
王小王-1238 天前
大数据·hive·hadoop·分布式·hadoop公共自行车·共享单车大数据分析·hadoop共享单车
基于Hadoop的公共自行车数据分布式存储和计算平台的设计与实现随着绿色出行理念的不断深入,公共自行车作为城市短途交通的重要组成部分,在城市交通系统中扮演着日益重要的角色。其便捷、环保、经济的特点不仅缓解了交通拥堵,也符合城市可持续发展的战略方向。然而,随着共享单车行业规模的不断扩大,海量数据的产生也带来了前所未有的挑战。公共自行车系统每天都会产生巨量数据,涵盖用户信息、租用记录、骑行轨迹、地理位置等。这些数据呈现出“体量大、类型多、生成快”的大数据特征,传统的单机数据库已经难以满足对PB级数据的存储、快速检索及深度分析需求。如何高效存储、管理并挖掘这些海量数据的价值
桂成林8 天前
hive·hadoop·哈希算法
Hive UDF 开发实战:MD5 哈希函数实现关键改进点:关键改进点:临时函数部署:永久函数部署:性能测试对比:性能优化建议:监控与维护:安全注意事项:
王小王-1239 天前
hive·hadoop·flask·sqoop·pyecharts·hadoop餐饮大数据分析·hadoop美食数据分析
基于Hadoop的餐饮大数据分析系统的设计与实现本项目旨在构建一个从数据采集、存储、清洗、分析到可视化的一体化餐饮大数据分析系统。系统以爬取知名美食网站【豆果美食】的菜谱数据为数据源,通过多种大数据技术实现对菜谱信息的高效存储与分析,最终借助可视化工具为用户提供直观的数据洞察,支持餐饮行业的数据决策。
張萠飛19 天前
数据仓库·hive·hadoop
hive集群优化和治理常见的问题答案Hive 集群优化与治理常见问题答案合集A:A: 数据倾斜 是指某些Key的数据量远大于其他Key,导致任务执行缓慢甚至失败。
fpcc21 天前
c++·hive
c++26新功能—hive容器科学进步的过程一般来说都是从先解决常用的、迫切的问题开始,然后再逐步解决一些少见不迫切的问题,直到最终解决到认知程度内的诸多问题。举一个网上的例子,以前说咱们无法生产水笔的尖头上的钢球,其实这对于国内的技术来说并不难,只是并不迫切而且利润也有限,结果经常的提及就被当成一个问题了,很快就解决了。 C++作为一门技术,也是如此。STL中的容器,也是先从常见的向量、链表以及映射等等开始应用,然后是unordered_map等。大家都知道C++应用的一个重要场景就是游戏应用,而游戏应用中对数据结构往往有一些特殊的
liuze40823 天前
数据仓库·hive·hadoop
在VMware虚拟机集群中,完成Hive的安装部署Hive是分布式运行的框架还是单机运行的?Hive是单机工具,只需要部署在一台服务器即可。Hive虽然是单机的,但是它可以提交分布式运行的MapReduce程序运行。
雷神乐乐23 天前
数据仓库·hive·hadoop
Hive优化详细讲解目录一、表设计层面优化(一)合理设计表结构(二)使用分区表(三)使用分桶表(四)分区 + 分桶——先分区再分桶(优化范围查询)
Edingbrugh.南空23 天前
数据仓库·hive·hadoop
Hudi 与 Hive 集成在大数据领域,Hive 凭借其成熟的生态和类 SQL 的查询方式,成为数据仓库建设的常用工具;而 Hudi(Hadoop Upserts Deletes and Incrementals)则以高效的数据更新、删除及增量处理能力著称。将 Hudi 与 Hive 集成,能够让用户在享受 Hive 便捷查询的同时,利用 Hudi 强大的数据管理特性。本文将详细介绍二者集成的全流程,并重点标注易错点,助力开发者顺利完成集成工作。
Edingbrugh.南空23 天前
数据仓库·hive·hadoop
Hive集成Paimon在大数据领域,数据存储与处理技术不断演进,各类数据管理工具层出不穷。Apache Hive作为经典的数据仓库工具,以其成熟的生态和强大的批处理能力,长期服务于海量数据的存储与分析;而Apache Paimon作为新兴的流式湖仓存储引擎,具备实时写入、高效查询和统一批流处理等特性,为数据管理带来了新的活力。将Hive与Paimon进行集成,能够充分融合两者优势,实现数据的高效存储、实时处理与灵活分析。本文将基于Paimon官方文档,深入讲解Hive集成Paimon的全流程,助力开发者在大数据场景中发挥两者协
雷神乐乐24 天前
数据仓库·hive·hadoop
Hive的分区表(静态分区、动态分区)、分桶表、四种排序方式和数据加载方式目录一、分区表(一)静态分区1.概念2.示例3.静态分区表练习(二)动态分区1.概念2.插入动态分区表之前:要开启动态分区和开启非严格模式
Edingbrugh.南空1 个月前
hive·hadoop·apache
Apache Iceberg与Hive集成:非分区表篇在大数据处理领域,Apache Iceberg凭借其先进的表格式设计,为大规模数据分析带来了新的可能。当Iceberg与Hive集成时,这种强强联合为数据管理与分析流程提供了更高的灵活性和效率。本文将聚焦于Iceberg与Hive集成中的非分区表场景,详细介绍其工作机制、操作方法及相关注意事项,无论是刚接触大数据的新手,还是经验丰富的架构师,都能从中获取有价值的信息。
Edingbrugh.南空25 天前
数据仓库·hive·hadoop
SeaTunnel与Hive集成在大数据处理的复杂生态中,数据的高效流转与整合是实现数据价值的关键。Apache SeaTunnel作为一款高性能、分布式、易扩展的数据集成框架,能够快速实现海量数据的实时采集、转换和加载;而Apache Hive作为经典的数据仓库工具,为结构化数据的存储、查询和分析提供了坚实的基础。将Apache SeaTunnel与Hive进行集成,能够充分发挥两者的优势,构建起高效的数据处理链路,满足企业多样化的数据需求。本文将结合Apache SeaTunnel官方文档,详细介绍Apache SeaTunnel与
Edingbrugh.南空1 个月前
数据仓库·hive·hadoop
Hive 3.x数据静态脱敏与加密在大数据时代,数据已成为企业和组织的核心资产。作为数据处理的重要平台,Hive 3.x存储着大量敏感信息,如用户个人身份、财务数据、商业机密等。如何确保这些数据在存储和处理过程中的安全性,成为数据从业者关注的焦点。数据静态脱敏与加密,作为保障数据安全的关键技术,能够有效防止敏感信息泄露,为数据安全保驾护航。本文将深入探讨Hive 3.x环境下数据静态脱敏与加密的实现方法与应用实践。
Edingbrugh.南空1 个月前
数据仓库·hive·hadoop
Iceberg与Hive集成深度Hive原生仅支持非事务表(Non-ACID),存在以下痛点:Iceberg通过以下机制在Hive中实现完整ACID事务: