技术栈
hadoop
weixin_45729710
1 小时前
大数据
·
hadoop
·
分布式
Hadoop面试题
答:Hadoop的核心组件包括:HDFS(Hadoop分布式文件系统)、Yarn、MapReduce(分布式计算框架)以及Hadoop Common(通用工具库)
何亚告
1 小时前
大数据
·
hadoop
·
分布式
记一次项目上hadoop数据迁移
项目现状: 项目上需要更换底层云服务器商,需要将老项目环境hadoop数据迁移到新服务器hadoop上。
默默在路上
2 小时前
hive
·
hadoop
·
apache
apache-hive-3.1.3 show databases;报错
在部署hive时,出现了一些问题,比如hadoop版本不匹配或者jdk版本过高等等,特此进行整理。以下版本可以进行匹配:
talle2021
2 小时前
大数据
·
hadoop
·
mapreduce
Hadoop分布式计算框架【MapReduce】
目录1.MapReduce概述1.1 基本概念1.2 特点1.3 适用场景2.MapReduce原理2.1 基本概念
Francek Chen
16 小时前
大数据
·
hadoop
·
分布式
·
架构
【大数据基础】大数据处理架构Hadoop:01 Hadoop概述
【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈大数据技术原理与应用 ⌋ ⌋ ⌋专栏系统介绍大数据的相关知识,分为大数据基础篇、大数据存储与管理篇、大数据处理与分析篇、大数据应用篇。内容包含大数据概述、大数据处理架构Hadoop、分布式文件系统HDFS、分布式数据库HBase、NoSQL数据库、云数据库、MapReduce、Hadoop再探讨、数据仓库Hive、Spark、流计算、Flink、图计算、数据可视化,以及大数据在互联网领域、生物医学领域的应用和大数据的其他应用。 【GitCode
無森~
1 天前
大数据
·
hadoop
实战:单词数量统计案例
默认情况下AM的请求1.5G的内存,降低am的资源请求配置项到分配的物理内存限制以内。修改配置mapred-site.xml ,加入新内容(四台上都要修改,修改路径:/opt/hadoop-3.1.3/etc/hadoop/mapred-site.xml),修改后重启hadoop集群,重启再执行:
weixin_46244623
1 天前
运维
·
hive
·
hadoop
Hadoop / YARN / Hive 运维操作教程
本文整理了一份完整的 Hadoop、YARN、Hive 运维操作手册,包括配置同步、集群启动、服务管理、任务监控等常用运维操作。适用于多节点集群的管理和日常维护。
重生之绝世牛码
1 天前
大数据
·
linux
·
运维
·
hadoop
·
zookeeper
·
软件安装
·
hadoop高可用
Linux软件安装 —— Hadoop高可用安装(集成Zookeeper)
1、相关软件2、相关进程参考本人此篇文章:Linux软件安装 —— SSH免密登录参考本人此篇文章:Linux软件安装 —— JDK安装
roman_日积跬步-终至千里
1 天前
大数据
·
hadoop
·
hdfs
【Hadoop】HDFS Router-based Federation:解决 NameNode 扩展性问题的联邦方案
NameNode 因元数据开销、DataNode 心跳管理和 HDFS RPC 请求数量限制,存在扩展性瓶颈。传统 HDFS Federation 方案需要用户手动管理多个子集群,Router-based Federation(RBF)通过引入 Router 和 State Store 组件,实现了透明的联邦访问和自动化的子集群管理。
無森~
1 天前
大数据
·
hadoop
·
mapreduce
实战:温度分析
本文将通过一个案例来了解Hadoop中Partitioner,SortComparator,GroupingComparator。
重生之绝世牛码
1 天前
大数据
·
linux
·
运维
·
hadoop
·
zookeeper
·
flink
·
软件安装
Linux软件安装 —— Flink集群安装(集成Zookeeper、Hadoop高可用)
1、相关软件2、相关进程参考本人此篇文章:Linux软件安装 —— SSH免密登录参考本人此篇文章:Linux软件安装 —— JDK安装
無森~
2 天前
数据仓库
·
hive
·
hadoop
Hive概述
对比项Hive关系型数据库查询语句HQLSQL数据存储HDFSLocal FS or RawDevice
無森~
2 天前
数据仓库
·
hive
·
hadoop
Hive下载与安装
Hive中metastore (元数据存储)的三种模式:a)内嵌Derby模式b)直连数据库模式c)远程服务器模式
無森~
2 天前
数据仓库
·
hive
·
hadoop
Hive输出表信息中文乱码解决方案
输出表信息的时候,如果含有中文可能会出现乱码。检查hive_remote数据库创建,使用的utf8:检查表COLUMNS_V2的创建语句,发现表和COMMENT使用的latin1编码格式,所以出现中文乱码:
無森~
2 天前
大数据
·
hadoop
·
分布式
Hadoop序列化与反序列化
序列化定义:就是把内存中的对象,转换为字节序列,以便于存储到磁盘或网络传输,此过程被称为序列化。反序列化定义:将字节序列或磁盘中的持久化字节数据,转换为内存中的对象的过程。
计算机毕业编程指导师
2 天前
大数据
·
hadoop
·
python
·
spark
·
django
·
招聘
·
拉勾网
【计算机毕设选题】基于Spark的拉勾网招聘数据分析系统源码,Python+Django全流程
⭐⭐个人介绍:自己非常喜欢研究技术问题!专业做Java、Python、小程序、安卓、大数据、爬虫、Golang、大屏等实战项目。 ⛽⛽实战项目:有源码或者技术上的问题欢迎在评论区一起讨论交流! ⚡⚡有什么问题可以在主页上或文末下联系咨询博客~~ ⚡⚡Java、Python、小程序、大数据实战项目集](https://blog.csdn.net/2301_80395604/category_12487856.html)
Msshu123
2 天前
hadoop
·
mongodb
·
nosql
·
memcache
·
tdengine
多功能快充诱骗芯片 XSP26支持与主板共用一个Type-C可取电可输出数据
在快节奏的生活中,时间成为了最宝贵的资源。Type-C PD芯片以其高达100W甚至更高功率传输的能力,彻底颠覆了传统充电方式的局限。它能够在短时间内为笔记本、手机、平板乃至高端游戏机等设备迅速补充电量,极大地缩短了充电等待时间,让用户在忙碌中也能轻松应对电量焦虑。这种革命性的充电速度,不仅提升了用户体验,更推动了移动办公、远程学习等现代生活方式的普及与发展。
B站计算机毕业设计超人
3 天前
大数据
·
hive
·
hadoop
·
python
·
毕业设计
·
知识图谱
·
课程设计
计算机毕业设计Python+百度千问大模型微博舆情分析预测 微博情感分析可视化 大数据毕业设计(源码+LW文档+PPT+讲解)
温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片!温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片!
王九思
3 天前
大数据
·
hive
·
hadoop
大数据查询工具Hive介绍
Hive是基于Hadoop的数据仓库工具,由Facebook开发并开源,提供了类似SQL的查询语言HiveQL,允许用户通过熟悉的SQL语法处理存储在分布式文件系统(如HDFS)中的大规模数据。Hive将SQL查询转换为MapReduce、Tez计算任务,极大简化了大数据分析的门槛。
王九思
3 天前
数据仓库
·
hive
·
hadoop
Hive Hook 机制
Hive Hook 是 Apache Hive 提供的一种扩展机制,允许开发者在 Hive 执行的特定阶段插入自定义逻辑。通过 Hook,可以在查询解析、优化、执行等关键节点进行拦截和干预,实现审计、监控、安全控制等功能。