hadoop

杂家13 小时前
大数据·hadoop·分布式
Hadoop完全分布式部署(超详细)准备3台服务器,具体规划如下: 一、非高可用模式二、高可用模式点击:Hadoop官网下载地址
BD_Marathon13 小时前
大数据·hadoop·分布式
【Hadoop】hadoop3.3.1完全分布式配置ssh-keygenssh-copy-id masterssh-copy-id worker1ssh-copy-id worker2
Q264336502317 小时前
大数据·hadoop·python·信息可视化·数据分析·spark·毕业设计
【有源码】基于Hadoop+Spark的起点小说网大数据可视化分析系统-基于Python大数据生态的网络文学数据挖掘与可视化系统注意:该项目只展示部分功能,如需了解,文末咨询即可。发语言:python 采用技术:Spark、Hadoop、Django、Vue、Echarts等技术框架 数据库:MySQL 开发环境:PyCharm
yumgpkpm1 天前
大数据·hive·hadoop·spark·apache·hbase·cloudera
CMP(类Cloudera CDP 7.3 404版华为泰山Kunpeng)和Apache Doris的对比Cloudera CMP 7.3和Apache Doris的对比Cloud Data AI CMP 7(尤其是主流版本如 CMP 7.1.x / 7.3)与 Apache Doris 是两类定位截然不同的大数据系统,前者是企业级大数据平台套件,后者是高性能实时分析型数据库。它们并非直接竞品,但在某些场景(如交互式查询、BI 分析)存在功能重叠。以下是全面对比:
yumgpkpm3 天前
大数据·hive·hadoop·python·oracle·flink·cloudera
Doris在CMP7(类Cloudera CDP 7 404版华为Kunpeng)启用 Kerberos部署DorisDoris在CMP7(类Cloudera CDP 7 404版)启用 Kerberos部署Doris这三种场景下,Apache Doris 与 CMP 的集成策略需区别对待。下面我将分别说明 可行方案、安全集成要点、实施建议,并提供 可运行的代码/脚本模板(包括 Kerberos 配置、Spark Connector 示例、Hive Catalog 配置等)。
数据牧羊人的成长笔记3 天前
hadoop·eclipse·mapreduce
Hadoop 分布式计算MapReduce和资源管理Yarn目录一、MapReduce概述1.1 MapReduce定义1.2 MapReduce优缺点1.3 MapReduce工作流程
新疆嘉博智选科技有限公司3 天前
大数据·hadoop·分布式
Macos系统上搭建Hadoop详细过程cd /Library/Hadoop curl -O https://archive.apache.org/dist/hadoop/core/hadoop-3.3.6/hadoop-3.3.6.tar.gz sudo tar -zxf hadoop-3.3.6.tar.gz sudo mv hadoop-3.3.6 hadoop
计算机编程-吉哥3 天前
大数据·hadoop·毕业设计·计算机毕设·大数据毕业设计选题推荐
大数据毕业设计项目推荐 基于大数据的广西药店数据可视化分析系统 1.65w条数据【大数据毕业设计项目选题】🍊作者:计算机编程-吉哥 🍊简介:专业从事JavaWeb程序开发,微信小程序开发,定制化项目、 源码、代码讲解、文档撰写、ppt制作。做自己喜欢的事,生活就是快乐的。 🍊心愿:点赞 👍 收藏 ⭐评论 📝 🍅 文末获取源码联系
小湘西3 天前
数据仓库·hive·hadoop
在 Hive 中NULL的理解在 Hive 中,NULL 是一个特殊的值,表示“未知”或“缺失”。任何与 NULL 的比较操作(如 =, >, <, >=, <=, <>)都会返回 NULL,而不是 TRUE 或 FALSE。
牛奶咖啡133 天前
hadoop·zabbix·docker-ce引擎安装·监控docker容器·监控ssl证书的过期时间·监控hadoop·安装配置agent2
zabbix实现监控Hadoop、Docker、SSL证书过期时间应用的保姆级实操流程Linux中安装部署Hadoop集群的保姆级安装配置教程https://coffeemilk.blog.csdn.net/article/details/154075870?spm=1001.2014.3001.5502
小鹿学程序4 天前
大数据·hadoop·分布式
搭建hadoop集群完成虚拟机环境(网络配置、免密登录、JDK 安装)后,下一步确实可以开始搭建 Hadoop 集群了。Hadoop 集群的搭建、部署与管理需要按步骤推进,以下是详细流程和关键操作,帮助你顺利完成.
John Song4 天前
大数据·hadoop·debian
用zookpeer搭建Hadoop的HA集群,组件启动的启动顺序是什么?在 ZooKeeper 搭建 Hadoop HA 集群时,启动顺序非常重要,错误的顺序会导致服务无法正常启动或无法实现高可用。
qq_12498707535 天前
大数据·hadoop·分布式·毕业设计
基于hadoop的电商用户行为分析系统(源码+论文+部署+安装)程序分为用户端和管理员端两大模块,功能覆盖用户交互、数据管理与分析全流程。系统采用分层架构设计,从数据处理到功能呈现形成清晰流程,核心架构分为以下四层:
临风赏月5 天前
hadoop·flink·kafka
Hadoop、Kafka、Flink、Spark、Hive五大组件运维常用操作命令Hadoop、Kafka、Flink、Spark、Hive五大组件运维高频操作命令,按“启动/停止、状态检查、核心管理、问题排查”分类整理,覆盖日常集群维护、任务调度、故障处理场景,命令基于主流稳定版本(Hadoop 3.x、Kafka 3.x、Flink 1.15+、Spark 3.x、Hive 3.x)。
笨蛋少年派5 天前
数据仓库·hive·hadoop
Hive安装部署目录Metastore部署模式内嵌模式本地模式远程模式Hive远程部署模式安装部署一、环境说明二、Hadoop集群配置
罗不俷6 天前
大数据·hadoop·分布式
【Hadoop】Hadoop 起源与核心组件解析 —— 大数据时代的分布式基石目录一、Hadoop 的 “前世今生”:从搜索引擎到大数据标准1. 起源:从 Nutch 到 Hadoop 的诞生
还是大剑师兰特6 天前
大数据·hadoop·分布式
Hadoop面试题及详细答案 110题 (106-110)-- Hadoop高级与实战《前后端面试题》专栏集合了前后端各个知识模块的面试题,包括html,javascript,css,vue,react,java,Openlayers,leaflet,cesium,mapboxGL,threejs,nodejs,mangoDB,SQL,Linux… 。
努力成为一个程序猿.7 天前
大数据·hadoop·spark
【问题排查】hadoop-shaded-guava依赖问题报错信息如下:从日志可以看出是因为缺失某个依赖导致。我先说说我的排查方向,比较笨重因为代码逻辑是利用spark读取S3文件用到了hadoop-aliyun的依赖,而adoop-aliyun依赖在AliyunOssUtils类中import了org/apache/hadoop/thirdpart/com/goole/common/base/Preconditions类,hadoop原生的依赖包并不会提供该依赖的支持所以在spark-submit时报错。知道问题就比较好解决了。
yumgpkpm7 天前
大数据·人工智能·hive·hadoop·机器学习·zookeeper·cloudera
CMP(类ClouderaCDP7.3(404次编译) )完全支持华为鲲鹏Aarch64(ARM)使用 AI 优化库存水平、配送路线的具体案例及说明CMP(类ClouderaCDP7.3(404次编译) )完全支持华为鲲鹏Aarch64(ARM)使用 AI 优化库存水平、配送路线的具体案例及说明
饼干吖7 天前
大数据·hadoop·教程
hadoop安装这里为什么使用ubuntu Server 24.04.3 LTS而不是常规ubuntu呢?因为我电脑差...