hadoop

菜鸟小码17 小时前
大数据·hadoop·分布式
Hadoop大数据时代的底座和基石说起大数据,很多人脑海中第一个浮现的就是Hadoop。但Hadoop到底是个啥?它是一个框架、一个生态,还是一种理念?这篇文章,带你一次性把Hadoop彻底搞清楚。
YJlio2 天前
运维·hive·hadoop·windows·游戏·microsoft·计算机外设
1 4.1 微软商店的使用(Microsoft Store:下载/安装/管理应用与游戏)当我需要装一些常见软件(比如聊天工具、效率工具、轻量小游戏)时,我现在越来越倾向于先去 Microsoft Store(微软商店) 看看。书里提到:在 Windows 11 中,我可以通过微软商店来 下载安装以及管理软件,包括各种应用软件和游戏;这些软件和游戏都经过微软审核,安全性更值得信任,而且新的微软商店也已经推广到 Windows 10。
sunxunyong2 天前
hadoop
kyuubi 连接kerberos集群配置kyuubi-defaults配置:kyuubi.engine.share.level = CONNECTION (必须为大写!) kinit与配置的keytab必须统一! kyuubi节点必须有这个keytab! kinit -kt XXXX.keytab XXXX@XX.COM /usr/dif/7.1.0-0/kyuubi/bin/beeline -u ‘jdbc:hive2://XXXX-17-70:2181,XXXX-17-71:2181,XXXX-17-80:2181/;serviceDisc
坚持就完事了2 天前
hadoop·学习
Hadoop实战初步学习在完全分布模式下,必须同时启动所有虚拟机和Hadoop服务,集群才能正常工作。Hadoop是一个“主从架构”的分布式系统,Master节点(NameNode, ResourceManager)本身不存储数据,也不执行计算任务。
It's Q3 天前
hive·hadoop·学习
hive学习分区&&函数在hdfs上创建文件夹string数据,需要添加单‘’不区分静态分区:先创建,再加载数据 动态分区:直接加载数据,根据数据动态创建分区 混合分区:有静态,还有动态,某个字段指定;
lifewange3 天前
大数据·hadoop·npm
Hadoop 全套常用 Shell 命令完整版Hadoop 全套常用 Shell 命令完整版,分为 HDFS 文件操作、YARN 任务管理、集群查看、本地启动关闭、常用运维命令,面试、日常开发直接背直接用。
lifewange3 天前
大数据·hadoop·分布式
Hadoop 完整入门详解Apache Hadoop 是 Apache 开源的大数据分布式基础框架,基于廉价普通服务器集群,解决 PB/EB 级海量数据的存储、离线批量计算 问题,是整个大数据生态的基石。灵感源自 Google GFS、MapReduce 论文,Java 开发,名字源于创始人儿子的玩具大象。
菜鸟小码4 天前
hive·hadoop·架构
Hive数据模型、架构、表类型与优化策略Hive作为大数据生态系统中的重要组成部分,通过其灵活的数据模型为海量数据的存储和查询提供了强大支持。本文将从Hive数据模型的基本架构出发,详细解析内部表、外部表、分区表和分桶表等核心表类型,深入探讨MAP、ARRAY、STRUCT等复杂数据类型的应用场景,剖析星型模型与雪花模型在数据仓库中的实现方式,并提供数据模型优化的最佳实践,帮助读者构建高效、可扩展的大数据处理架构。
IT从业者张某某4 天前
hive·hadoop·docker
基于Docker的hadoop容器安装hive并测试Docker部署伪分布Hadoop 要在现有的 Hadoop 容器中安装 Zookeeper,我们需要执行以下步骤:
IT从业者张某某4 天前
hadoop·docker·zookeeper
基于Docker的hadoop容器安装zookeeperDocker部署伪分布Hadoop 要在现有的 Hadoop 容器中安装 Zookeeper,我们需要执行以下步骤:
菜鸟小码4 天前
数据仓库·hive·hadoop
深入理解 Hive 数据模型在 Hadoop 生态中,Hive 作为数据仓库的核心组件,其数据模型的设计直接影响查询性能、存储效率和维护成本。本文将带你全面掌握 Hive 数据模型的各个层次,从数据库、表、分区到分桶,配合大量实战案例,让你真正掌握数仓建模的精髓。
菜鸟小码4 天前
数据仓库·hive·hadoop
Hive环境搭建与配置优化Hive作为大数据生态系统中不可或缺的组件,为非技术人员提供了使用SQL操作Hadoop数据的能力。本文将详细介绍如何在Linux环境下安装配置Hive 3.1.2,并解决实际部署中常见的依赖冲突和兼容性问题,帮助您快速搭建高效稳定的大数据处理环境。
菜鸟小码5 天前
数据仓库·hive·hadoop
Hive数据类型全解析:从基础到复杂类型实战指南Apache Hive作为Hadoop生态系统中的核心数据仓库工具,提供了丰富多样的数据类型系统,以满足从简单标量值到复杂嵌套结构的多样化数据存储需求。Hive的数据类型设计既保留了传统关系型数据库的简洁性,又融入了面向半结构化数据的灵活性,使其成为大数据生态中处理结构化和非结构化数据的理想选择。本文将全面解析Hive的数据类型体系,从基本数据类型到复杂数据类型的定义、特点、使用场景及实际案例,帮助读者在实际工作中做出更明智的数据类型选择。
IT从业者张某某5 天前
hadoop·docker·容器
Docker部署伪分布Hadoop创建目录创建Dockerfile和entrypoint.sh把hadoop-3.3.0.tar.gz 放到~/hadoop-pseudo/
菜鸟小码5 天前
数据仓库·hive·hadoop
深入浅出 Hive 数据类型:从入门到实战在大数据领域,Hive 作为数据仓库的核心工具,其数据类型体系是构建高效数仓的基石。本文将带你全面掌握 Hive 的所有数据类型,并通过大量案例和代码让你真正会用、用对。
Roselind_Yi6 天前
大数据·hadoop·经验分享·笔记·分布式·数据挖掘·云计算
云计算实验实操|Hadoop伪分布式部署+MapReduce编程实践(超详细图文版)前两篇博客分享了OpenStack Keystone和CloudSim的实验实操,这篇继续更新云计算核心实验的后两个环节——Hadoop 3.2.4伪分布式集群部署和MapReduce编程实践。
hINs IONN8 天前
hadoop·hdfs·架构
深入解析HDFS:定义、架构、原理、应用场景及常用命令Hadoop分布式文件系统(HDFS,Hadoop Distributed File System)是Hadoop框架的核心组件之一,它提供了高可靠性、高可用性和高吞吐量的大规模数据存储和管理能力。本文将从HDFS的定义、架构、工作原理、应用场景以及常用命令等多个方面进行详细探讨,帮助读者全面深入地了解HDFS。
隐于花海,等待花开8 天前
数据仓库·hive·hadoop
Hive 常用函数详细总结本文汇总了 Hive 开发与面试中最常用、最实用的内置函数,每个函数均附有语法说明和代码示例。内容涵盖:字符串处理、日期时间、条件判断、聚合统计、开窗分析、集合操作、类型转换、JSON 解析等。
docsz9 天前
大数据·hadoop
据数据基座搭建说明:基于目前公司使用的是RockyLinux8.x,推荐使用DataSophon或Apache Hadoop原生部署。
曹宇飞丶10 天前
hadoop·ambari
ambari server及元数据库(postgreSQL)迁移1.1停止Hive1.2停止ranger备份配置文件目录备份密钥目录记录当前数据库连接信息全局角色信息