hdfs

顧棟1 天前
大数据·hadoop·hdfs
HDFS2.X升级3.X案例与相关Issue
tumeng07118 天前
hadoop·hdfs·架构
HDFS的架构优势与基本操作如今,数据正以指数级增长,各行各业都在追求更多的数据存储、高效的数据处理和可靠的数据基础来驱动业务的发展。Hadoop Distributed File System(HDFS)作为Hadoop生态系统的核心组件之一,成为构建可靠的大数据基础的不二选择之一。本文将深入剖析HDFS的架构与优势。
sunxunyong9 天前
大数据·hadoop·hdfs
HDFS nnsdy重新配置启动1、hdfs进入safemode安全模式 在active nn节点执行:hdfs dfsadmin -safemode enter 2、全量生产fsiamge文件 在active节点执行:hdfs dfsadmin -saveNamespace 3、在active节点执行hdfs dfsadmin -safemode leave 4、处理standby nn 先清空standby nn节点/data1/hadoop/hdfs/namenode/current/目录和/data2/hadoop/hdfs/n
Jianghong Jian9 天前
大数据·hadoop·hdfs
HDFS常用的JAVA API全国新冠肺炎疫情数据上传到Hadoop里面的HDFS。数据集来源:https://github.com/eAzure/Code-For-COVID-19-Data
迈巴赫车主10 天前
大数据·hadoop·hdfs
大数据:Hadoop(HDFS)HDFS(Hadoop Distributed File System),它是一个文件系统HDFS的使用场景:适合一次写入,多次读出的场景
hellolianhua13 天前
大数据·hadoop·hdfs
测试集群hdfs和mapreduce1.创建一个data.txt文件2.创建一个hdfs的文件夹3.将本地文件上传到hdfs系统4.查看文件上传
Francek Chen17 天前
大数据·数据库·hadoop·分布式·hdfs·hbase
【大数据存储与管理】分布式数据库HBase:05 HBase运行机制【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈大数据技术原理与应用 ⌋ ⌋ ⌋专栏系统介绍大数据的相关知识,分为大数据基础篇、大数据存储与管理篇、大数据处理与分析篇、大数据应用篇。内容包含大数据概述、大数据处理架构Hadoop、分布式文件系统HDFS、分布式数据库HBase、NoSQL数据库、云数据库、MapReduce、Hadoop再探讨、数据仓库Hive、Spark、流计算、Flink、图计算、数据可视化,以及大数据在互联网领域、生物医学领域的应用和大数据的其他应用。 【GitCode
网络工程小王21 天前
大数据·hadoop·hdfs·big data
【大数据技术详解】——HBase技术(学习笔记)目录HBase 技术深度解析一、核心定位与适用场景✅ 典型用途🎯 适用场景(CAP 理论:CP 系统)
乐hh23 天前
java·大数据·hadoop·hdfs·zookeeper·flink·yarn
Hadoop 3.3.5 + Flink 1.15.3 集群完整部署手册(3节点标准版)本手册基于实际操作中遇到的所有问题整理而成,包含详细的避坑指南。环境为3台虚拟机(2C/4G),IP规划如下:
qq56801807623 天前
hadoop·hdfs·架构
HDFS的架构优势与基本操作如今,数据正以指数级增长,各行各业都在追求更多的数据存储、高效的数据处理和可靠的数据基础来驱动业务的发展。Hadoop Distributed File System(HDFS)作为Hadoop生态系统的核心组件之一,成为构建可靠的大数据基础的不二选择之一。本文将深入剖析HDFS的架构与优势。
Francek Chen23 天前
大数据·数据库·hadoop·分布式·hdfs·hbase
【大数据存储与管理】分布式数据库HBase:03 HBase数据模型【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈大数据技术原理与应用 ⌋ ⌋ ⌋专栏系统介绍大数据的相关知识,分为大数据基础篇、大数据存储与管理篇、大数据处理与分析篇、大数据应用篇。内容包含大数据概述、大数据处理架构Hadoop、分布式文件系统HDFS、分布式数据库HBase、NoSQL数据库、云数据库、MapReduce、Hadoop再探讨、数据仓库Hive、Spark、流计算、Flink、图计算、数据可视化,以及大数据在互联网领域、生物医学领域的应用和大数据的其他应用。 【GitCode
网络工程小王24 天前
hadoop·hdfs·big data
【大数据技术详解】——HDFS技术(学习笔记)HDFS(Hadoop Distributed File System)是 Hadoop 的核心组件之一,设计用于存储超大规模数据集,并运行在廉价硬件上。其核心特点包括:
江畔何人初1 个月前
大数据·hadoop·hdfs
hadoop中HDFS框架、YARN框架各组件职责与对比HDFS(Hadoop Distributed File System)是 Hadoop 的分布式存储系统。它的设计目的是能够处理海量数据,确保数据存储的高可靠性和高可用性。这个系统的核心结构主要包括 NameNode、DataNode、Secondary NameNode 和 HDFS Client。我们来逐个了解它们的作用。
Francek Chen1 个月前
大数据·hadoop·分布式·hdfs
【大数据存储与管理】分布式文件系统HDFS:05 HDFS存储原理【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈大数据技术原理与应用 ⌋ ⌋ ⌋专栏系统介绍大数据的相关知识,分为大数据基础篇、大数据存储与管理篇、大数据处理与分析篇、大数据应用篇。内容包含大数据概述、大数据处理架构Hadoop、分布式文件系统HDFS、分布式数据库HBase、NoSQL数据库、云数据库、MapReduce、Hadoop再探讨、数据仓库Hive、Spark、流计算、Flink、图计算、数据可视化,以及大数据在互联网领域、生物医学领域的应用和大数据的其他应用。 【GitCode
张二森1 个月前
hdfs
分布式存储的战争(一)大数据的基石-HDFS的崛起本系列文章分为五篇本文为第一篇在HDFS的诞生之前,大容量存储通常都是以一种称为“硬件定义存储”的方式来实现,比如通过构建 SAN(存储区域网络) 等复杂的硬件互联架构来实现。而2003 Google GFS的论文则给了另外一种思路,使用”软件定义存储“,即利用普通商用服务器和通用网络,通过软件层的设计来构建高可靠、高扩展的分布式存储系统。
Francek Chen2 个月前
大数据·hadoop·分布式·hdfs
【大数据存储与管理】分布式文件系统HDFS:03 HDFS的相关概念【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈大数据技术原理与应用 ⌋ ⌋ ⌋专栏系统介绍大数据的相关知识,分为大数据基础篇、大数据存储与管理篇、大数据处理与分析篇、大数据应用篇。内容包含大数据概述、大数据处理架构Hadoop、分布式文件系统HDFS、分布式数据库HBase、NoSQL数据库、云数据库、MapReduce、Hadoop再探讨、数据仓库Hive、Spark、流计算、Flink、图计算、数据可视化,以及大数据在互联网领域、生物医学领域的应用和大数据的其他应用。 【GitCode
小邓睡不饱耶2 个月前
hadoop·hdfs·spark
Hadoop 3.x实战:基于HDFS+Spark+Flink的实时用户行为分析平台(含Kerberos安全配置+冷热数据分层)在大数据实时化、安全合规要求升级的当下,传统Hadoop集群面临“实时处理弱、安全防护不足、存储成本高”三大痛点。本文基于 Hadoop 3.3.6(最新稳定版),设计一套“离线批处理+实时流计算”一体化的用户行为分析平台,整合HDFS 3.x、Spark 3.4.1、Flink 1.17.0核心组件,融入Kerberos身份认证、HDFS冷热数据分层、列式存储优化等企业级特性,全程拆解从集群部署到业务落地的完整流程,附关键配置与代码实现,可直接适配电商、短视频等场景的用户行为分析需求。
Francek Chen2 个月前
大数据·hadoop·分布式·hdfs·架构
【大数据存储与管理】分布式文件系统HDFS:01 分布式文件系统【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈大数据技术原理与应用 ⌋ ⌋ ⌋专栏系统介绍大数据的相关知识,分为大数据基础篇、大数据存储与管理篇、大数据处理与分析篇、大数据应用篇。内容包含大数据概述、大数据处理架构Hadoop、分布式文件系统HDFS、分布式数据库HBase、NoSQL数据库、云数据库、MapReduce、Hadoop再探讨、数据仓库Hive、Spark、流计算、Flink、图计算、数据可视化,以及大数据在互联网领域、生物医学领域的应用和大数据的其他应用。 【GitCode
十月南城2 个月前
hadoop·hdfs·mapreduce
Hadoop基础认知——HDFS、YARN、MapReduce在现代体系中的位置与价值写在前面,本人目前处于求职中,如有合适内推岗位,请加:lpshiyue 感谢。HDFS 是海量数据的基座,MapReduce 是批量计算的引擎,而 YARN 是集群资源的调度者——它们共同构成了大数据处理的“古典三位一体”。
蓝眸少年CY2 个月前
大数据·hadoop·hdfs
Hadoop2-HDFS文件系统目录一、概述1、定义2、特点3、核心架构(主从架构)4、特性5、优缺点6、架构7、文件快大小二、shell操作