hive

lucky_syq20 分钟前
大数据·hive·spark
Spark和Hive的区别
小刘鸭!11 小时前
数据仓库·hive·hadoop
Hive解决数据倾斜数据倾斜(Data Skew)问题是指在分布式计算系统中,由于某些数据分布不均匀,导致某些节点处理的数据量远远大于其他节点,从而引起性能瓶颈、计算延迟甚至计算失败的现象。
武子康15 小时前
大数据·数据仓库·hive·hadoop·spring
大数据-255 离线数仓 - Atlas 数据仓库元数据管理 数据血缘关系 元数据目前开始更新 MyBatis,一起深入浅出!上节我们完成了:元数据(MetaData)狭义的解释是用来描述数据的数据。广义来看,除了业务逻辑直接读写处理的那些业务数据,所有其他用来维持整个系统运转所需的信息、数据都可以叫做元数据,如数据库中表的Schema信息,任务的血缘关系,用户和脚本、任务的权限映射关系信息等。
我不会敲代码a2 天前
hive·hadoop·架构
hive架构简述Hive起源于Facebook,Facebook公司有着大量的日志数据,而Hadoop是实现了MapReduce模式开源的分布式并行计算的框架,可轻松处理大规模数据。然而MapReduce程序对熟悉Java语言的工程师来说容易开发,但对于其他语言使用者则难度较大。因此Facebook开发团队想设计一种使用SQL语言对日志数据查询分析的工具,而Hive就诞生于此,只要懂SQL语言,就能够胜任大数据分析方面的工作,还节省了开发人员的学习成本。
吴法刚2 天前
大数据·hive·spark
案例:Spark/Hive中‘String=数值类型’丢失精度问题a.id e.clue_id dt timestamp1734933297158217731 1734933297158217731 2023-12-14 2023-12-14 16:51:32 1734933297158217731 1734933297158217729 2023-12-14 2023-12-14 16:53:06 1734933297158217731 1734933297158217730 2023-12-14 2023-12-14 16:51:32
B站计算机毕业设计超人2 天前
大数据·hive·python·深度学习·机器学习·spark·课程设计
计算机毕业设计python+spark+hive动漫推荐系统 漫画推荐系统 漫画分析可视化大屏 漫画爬虫 漫画推荐系统 漫画爬虫 知识图谱 大数据毕设温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片!温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片!
武子康3 天前
java·大数据·数据仓库·hive·hadoop·springboot
大数据-253 离线数仓 - Airflow 任务调度 核心概念与实际案例测试 Py脚本编写目前开始更新 MyBatis,一起深入浅出!Apache Airflow 是一个开源的任务调度和工作流管理工具,用于编排复杂的数据处理任务。最初由 Airbnb 开发,于 2016 年捐赠给 Apache 软件基金会。Airflow 的主要特点是以代码方式定义任务及其依赖关系,支持任务的调度和监控,适合处理复杂的大数据任务。
逸曦玥泱3 天前
hive·hadoop·分布式
搭建分布式Hive集群若使用方案一,则在master节点上进行”准备工作“在master主节点上执行如果选择方案一部署,则数据库信息填写master主机的信息,hive服务器填写master主机
BenChuat3 天前
hive·redis·mongodb·hbase
HBase、Hive、Redis 和 MongoDB的对比以下是 HBase、Hive、Redis 和 MongoDB 中进行表结构增改操作的总结,具体包括表的增加和修改操作。
黑色叉腰丶大魔王3 天前
数据仓库·hive·hadoop
《Hive 存储格式详解》一、引言在大数据处理中,Hive 是一个广泛使用的数据仓库工具,它提供了一种类似于 SQL 的查询语言,使得用户可以方便地对大规模数据集进行分析和处理。Hive 的存储格式对于数据的存储效率、查询性能和数据压缩等方面都有着重要的影响。本文将详细介绍 Hive 的存储格式,包括常见的存储格式类型、特点和适用场景。
zmd-zk4 天前
大数据·数据库·hive·分布式·python·mysql·spark
spark将数据输出到hive或mysql中
NiNg_1_2344 天前
hive·hadoop·云计算
云计算中的Hive操作详解Hive是云计算中一个非常重要的组件,它是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。Hive的本质是将SQL查询转换为MapReduce/Spark任务进行执行,从而简化了大数据处理的复杂性。本文将详细介绍Hive的基本操作和使用示例。
zmd-zk4 天前
大数据·hive·python·学习·mysql·spark
spark读取hive和mysql的数据修改配置文件
Oceanside_yh4 天前
数据仓库·hive·hadoop
MacbookPro M1 安装Hive前提注意⚠️⚠️⚠️1)在安装Hive前确实需要安装MySQL,因为Hive可以使用MySQL作为元数据存储
大数据魔法师4 天前
数据库·hive
HiveQL命令(一)- 数据库操作本指南旨在提供一份全面而详细的 Hive 数据库操作手册,帮助读者深入理解并熟练运用 Hive 中的数据库管理命令。我们将从最基础的创建数据库开始,逐步介绍如何查看现有数据库及其信息、切换当前使用的数据库、修改数据库属性及位置,直到最后讲解如何删除不再需要的数据库。
2401_890666134 天前
java·c++·hive·spring boot·c#·php·课程设计
(免费送源码)计算机毕业设计原创定制:Java+spring boot+MySQL springboot社区快递代取服务系统摘 要信息化社会内需要与之针对性的信息获取途径,但是途径的扩展基本上为人们所努力的方向,由于站在的角度存在偏差,人们经常能够获得不同类型信息,这也是技术最为难以攻克的课题。针对社区快递代取服务系统等问题,对社区快递代取服务系统进行研究分析,然后开发设计出社区快递代取服务系统以解决问题。
昨夜花落尽6 天前
hive·hdfs·sqoop
sqoop导入hdfs,hivesqoop将mysql中的表导入到hdfs中将数据导入hive中,首先要在hive中创建目标表然后导入
叫我DPT6 天前
数据仓库·hive·hadoop
Hive高级查询对于UDTF表生成函数,很多人难以理解什么叫做输入一行,输出多行。为什么叫做表生成?能够产生表吗?下面我们就来学习Hive当做内置的一个非常著名的UDTF函数,名字叫做explode函数,中文戏称之为“爆炸函数”,可以炸开数据。
上辈子杀猪这辈子学IT7 天前
大数据·数据库·数据仓库·hive·hadoop
【Hive数据仓库】Hive部署、Hive数据库操作(增删改查)、表操作(内部表、外部表、分区表、桶表)目录一、本地模式1、安装MySQL2、登录MySQL3、修改密码4、安装Hive5、配置Hive系统环境变量
sunxunyong7 天前
数据仓库·hive·hadoop
hive 小文件分析1、获取fsimage文件: hdfs dfsadmin -fetchImage /data/xy/ 2、从二进制文件解析: hdfs oiv -i /data/xy/fsimage_0000000019891608958 -t /data/xy/tmpdir -o /data/xy/out -p Delimited -delimiter “,” 3、创建hive表 create database if not exists hdfsinfo; use hdfsinfo; CREATE TABLE fsi