hadoop

奇点爆破XC18 小时前
大数据·hadoop·ambari
Hadoop大数据生态(Ambari管理)组件服务详解本文档整理Ambari集群全量核心组件、附属工具及安全服务,按业务模块分类,清晰说明各服务、角色的定位与核心功能,适用于集群运维、学习查阅、台账备案。
段一凡-华北理工大学21 小时前
大数据·人工智能·hadoop·分布式·学习·架构·高炉炼铁
工业领域的Hadoop架构学习~系列文章22:Hadoop生态展望 - 面向未来的技术演进导言:大数据技术正在经历深刻变革,云原生化、湖仓一体、AI融合成为新的发展方向。本期深入探讨Hadoop生态的技术演进趋势,分析云原生Hadoop、数据网格、向量数据库等前沿技术,为企业和开发者提供技术路线参考。
Nefu_lyh1 天前
数据仓库·hive·hadoop
【Hive】六、Hive 运算逻辑:数学 / 逻辑 / 条件 / 日期 / 字符串函数Hive 支持标准 SQL 的数学运算符,用于数值计算。用于条件判断和布尔运算,返回 TRUE/FALSE/NULL。
知识分享小能手1 天前
hadoop·学习·hdfs
Hadoop学习教程,从入门到精通, HDFS分布式文件系统 — 完整知识点与案例代码(3)HDFS(Hadoop Distributed File System)是 Apache Hadoop 项目的核心子项目,是一个分布式、可扩展、高容错的文件系统。
段一凡-华北理工大学2 天前
大数据·人工智能·hadoop·学习·架构·高炉炼铁·工业智能体
工业领域的Hadoop架构学习~系列文章20:故障诊断与根因分析 - 从表象到本质的智能推理导言:故障诊断与根因分析是工业大数据平台的核心价值体现。本期深入讲解基于规则、基于统计、基于机器学习、基于知识图谱等多种故障诊断方法,详细剖析工业故障传播模型与因果推断技术,并结合实战代码展示完整的故障诊断与根因分析系统。
Francek Chen2 天前
大数据·hadoop·分布式·mapreduce
【大数据处理与分析】MapReduce:05 MapReduce的具体应用【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈大数据技术原理与应用 ⌋ ⌋ ⌋专栏系统介绍大数据的相关知识,分为大数据基础篇、大数据存储与管理篇、大数据处理与分析篇、大数据应用篇。内容包含大数据概述、大数据处理架构Hadoop、分布式文件系统HDFS、分布式数据库HBase、NoSQL数据库、云数据库、MapReduce、Hadoop再探讨、数据仓库Hive、Spark、流计算、Flink、图计算、数据可视化,以及大数据在互联网领域、生物医学领域的应用和大数据的其他应用。 【GitCode
知识分享小能手2 天前
大数据·hadoop·学习
Hadoop学习教程,从入门到精通, 部署Hadoop 3.x — 知识点详解(2)需要提前下载以下软件包:在部署之前,需要规划好集群的网络配置:步骤一:启动新建向导步骤二:选择硬件兼容性
AQin10122 天前
数据仓库·hive·hadoop·doris
【对比向】既生瑜何生亮?不!Hive 和 Doris不一样结论先行 -> 能看懂的就不用看后面的展开解释咯Hive 承担批处理 ETL 的数据生产责任(清洗→规范化→汇总),把最终需要被高频、低延迟、高并发查询的那部分结果(DWS/ADS/热明细)以批量的方式 Load 进 Doris;Doris 用合适的表模型和分区/分桶设计把这些结果变成"可交互查询",从而把 BI/运营/接口的体验从"分钟级"拉到"秒级"。
段一凡-华北理工大学2 天前
大数据·人工智能·hadoop·分布式·学习·架构·高炉炼铁
工业领域的Hadoop架构学习~系列文章19:能源行业Hadoop应用实践导言:能源行业是Hadoop大数据技术的重要应用领域,涵盖电力、石油、天然气、新能源等多个细分行业。本期深入讲解智能电网、油气生产优化、新能源运维等典型场景的Hadoop解决方案,从数据采集到智能分析,完整呈现能源大数据的落地实践。
知识分享小能手3 天前
大数据·hadoop·学习
Hadoop学习教程,从入门到精通, 初识Hadoop — 知识点详解(1)定义: 大数据(Big Data)是指传统数据处理软件工具无法在合理时间内完成采集、存储、管理和分析的大规模、复杂数据集合。其核心不仅在于数据量之"大",更在于从海量数据中提取有价值信息的能力。
青春万岁!!3 天前
数据仓库·hive·hadoop
hive分区表加字段后insert字段为空哈喽朋友们,昨天又在生产环境遇到一个分区表加字段后,insert 进去字段为空的问题。原因是要在分区表中加字段,一般为了不影响历史数据都通过alter table table_name add columns 加字段,环境依旧是华为云DataArts。
Eileen Seligman4 天前
大数据·hadoop·hdfs·ctf·rce
0CTF/TCTF 2023 OLAPInfra Nashorn RCE + HDFS UDF RCEClickHouse:是一个开源的列式数据库管理系统clickhouse-jdbc-bridge:clickhouse数据库和jdbc交互的工具
Sonnie0000001(马库斯)4 天前
大数据·hadoop·hdfs
【Hadoop之HDFS替换方案】【Haoop远程挂载Cubefs】Cubefs对接Hadoop生态为了解决Hadoop存算一体带来的问题,我对Hadoop的存算分离做了方案尝试,使用Cubefs替换现有的HDFS,相当于Hadoop的存储远程挂载,下面是踩坑记录。 官方参考链接
好问者4 天前
大数据·hadoop·hdfs
【大数据】:hdfs相关进程启停管理命令HADOOP_HOME/sbin/start-dfs.sh,一键启动HDFS集群执行原理:在执行此脚本的机器上,启动SecondaryNameNode
段一凡-华北理工大学4 天前
大数据·人工智能·hadoop·分布式·学习·架构·高炉炼铁
工业领域的Hadoop架构学习~系列文章18:制造业Hadoop应用实践 - 从数据到智能的完整闭环导言:制造业是Hadoop大数据技术最重要的应用领域之一。本期结合真实的智能制造场景,深入讲解生产质量分析、设备预测性维护、工艺参数优化、能源管理等典型应用,从业务需求到技术实现,完整呈现Hadoop在制造业的落地实践。
属鼠哥4 天前
大数据·hadoop
HDFS 短路本地读取系列(二):你以为的「本地读」和真正的「本地读」—getLegacy vs getBlockReaderLocal 的本质差异导语:在 HDFS 的读取路径中,BlockReaderFactory.build() 是客户端选择读取策略的总入口。在这个四级降级链路中,第二级和第三级分别由 getLegacyBlockReaderLocal() 和 getBlockReaderLocal() 接管。一个基于文件路径直接打开(HDFS-2246),一个基于 Unix Domain Socket 文件描述符传递(HDFS-347)。本文将深入 Hadoop 3.x源码,彻底解读这两个方法的内部机制、调用链路与设计哲学。
段一凡-华北理工大学4 天前
大数据·人工智能·hadoop·分布式·学习·架构·高炉炼铁
工业领域的Hadoop架构学习~系列文章17:Hadoop性能调优- 调度集群每一分性能导言:Hadoop集群的性能优化是一项系统工程,需要从JVM参数、内存管理、网络配置、磁盘IO等多个维度综合调优。本期深入剖析Hadoop各组件的性能瓶颈,详细讲解HDFS读写优化、YARN资源调度优化、MapReduce/Spark作业调优,并给出实战案例和监控方法。
段一凡-华北理工大学5 天前
大数据·人工智能·hadoop·机器学习·架构·工业智能体·高炉炼铁智能化
工业领域的Hadoop架构学习~系列文章15:机器学习与大数据融合 - 工业智能的算法引擎导言:机器学习与大数据平台的融合是工业智能化的核心驱动力。本期深入探讨Spark MLlib、FlinkML、TensorFlow on Spark等主流机器学习框架,详细讲解特征工程、模型训练、在线推理的全流程实战,并结合工业场景的异常检测、预测性维护、质量预测等典型应用。
Nefu_lyh5 天前
数据仓库·hive·hadoop
【Hive】三、Hive 抽样:讲解 Hive 三大抽样方式:分桶抽样、块抽样、随机抽样的原理、语法、性能对比与实战案例我的网站原文:https://eleanora-lyh.github.io/MyLearningNotes/ csdn处的文章会尽快同步更新,欢迎大家来访问!
05候补工程师5 天前
大数据·hadoop·经验分享·笔记·软件工程
【期末/408冲刺】软件工程核心考点与大题通关秘籍(附图解与解题套路)📝 导读: 无论是应对期末考试,还是为了后续 408 计算机统考打基础,软件工程的知识点都显得尤为繁杂。本文是我在近期专业课复习时整理的核心笔记,剥离了长篇大论,直接直击名词解释、简答题以及最关键的图表大题的解题命门。希望这些“套路”和“模板”能帮你节省复习时间。