技术栈
hadoop
王小王-123
21 小时前
hive
·
hadoop
·
数据分析
·
音乐数据分析
·
网易云音乐分析
·
hive音乐分析
·
hadoop网易云
基于 Hive 的网易云音乐数据分析及可视化系统
目录一、项目背景二、项目整体思路三、资料结构四、数据采集五、数据预处理六、Hive离线分析七、可视化大屏
极光代码工作室
1 天前
大数据
·
hadoop
·
python
·
spark
·
数据可视化
基于数据仓库的电商数据分析平台
随着电子商务行业持续高速发展,头部平台日均订单量突破千万级,用户行为日志达TB级规模,传统数据库与BI工具在面对多维、实时、高并发分析场景时暴露出查询延迟高、模型耦合强、扩展性差等瓶颈。本研究聚焦“构建面向电商场景的高性能、可扩展、语义清晰的数据分析平台”这一核心命题,基于Kimball维度建模理论,设计并实现了一套以Hadoop+Spark为核心引擎、以Star Schema为逻辑模型、以Apache Superset为可视化门户的端到端电商数据分析平台。系统完整覆盖从原始日志采集(Flume/Kafk
Chris _data
1 天前
hadoop
·
学习
·
wpf
WPF 学习第三天 — Modbus RTU 串口通信
Modbus 是一种工业通信协议,广泛应用于 PLC、传感器、驱动器等工业设备之间的通信。我们的项目使用的是 Modbus RTU over 串口。
知识分享小能手
1 天前
hadoop
·
学习
·
flume
Hadoop学习教程,从入门到精通,Flume日志采集系统 — 完整知识点与案例代码(9)
Apache Flume 是一个分布式、高可靠、高可用的日志采集、聚合和传输系统。它可以从多种数据源收集数据,将数据传输到集中式数据存储(如HDFS、HBase、Kafka等)。
Francek Chen
2 天前
大数据
·
hadoop
·
分布式
·
mapreduce
【大数据处理与分析】MapReduce:06 MapReduce编程实践
【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈大数据技术原理与应用 ⌋ ⌋ ⌋专栏系统介绍大数据的相关知识,分为大数据基础篇、大数据存储与管理篇、大数据处理与分析篇、大数据应用篇。内容包含大数据概述、大数据处理架构Hadoop、分布式文件系统HDFS、分布式数据库HBase、NoSQL数据库、云数据库、MapReduce、Hadoop再探讨、数据仓库Hive、Spark、流计算、Flink、图计算、数据可视化,以及大数据在互联网领域、生物医学领域的应用和大数据的其他应用。 【GitCode
王小王-123
2 天前
大数据
·
hadoop
·
数据分析
·
大数据房价分析
·
二手房价格预测
·
hive房价数据分析
基于 Hadoop 的二手房数据分析与可视化平台项目展示
目录项目整体介绍项目背景与建设思路技术架构与功能模块数据处理与分析设计系统界面与交互效果可视化大屏与图表展示
知识分享小能手
2 天前
数据库
·
hadoop
·
分布式
Hadoop学习教程,从入门到精通, HBase 分布式数据库 — 完整知识点与案例代码(8)
HBase(Hadoop Database)是一个分布式的、面向列的开源数据库,基于 Google Bigtable 的设计思想构建。
王小王-123
2 天前
大数据
·
hadoop
·
分布式
·
心脏病预测系统
·
疾病预测
·
冠心病风险预测
基于 Hadoop 的心脏病分析可视化与风险预测系统
目录一、项目背景:把健康数据真正用起来二、数据处理:从原始表到可分析数据三、可视化分析:让指标结果变成页面
TPBoreas
2 天前
数据仓库
·
hive
·
hadoop
springboot3.5比2.x做了哪儿些提升
先说结论:Spring Boot 3.5 相对 2.x,不是小版本升级,而是一整代(3.0 → 3.5)的现代化改造。3.5 是 3.x 的最后一个 minor,在 2.x 基础上叠加了基础栈换代 + 性能 + 开发体验 + 可观测性 + 运维能力。
Nefu_lyh
4 天前
数据仓库
·
hive
·
hadoop
【Hive】七、Hive 函数:聚合 / 统计 / 分位数 / 集合 / 高级分组
聚合函数(Aggregate Functions)是 Hive 中用于对一组行进行计算并返回单个结果的函数,通常配合 GROUP BY 使用,是数仓查询、报表统计的核心工具。
阿 才
4 天前
大数据
·
hadoop
·
分布式
跟文件系统(busybox)的构建
1、下载busybox:git clone git://busybox.net/busybox.git 下载完毕后,我们输入如下命令,切换到指定版本<busybox 1.36.1>
KANGBboy
4 天前
数据仓库
·
hive
·
hadoop
hive UDF函数
1.1 UDF(User-Defined-Function) 一进一出。 1.2 UDAF(User-Defined Aggregation Function) 用户自定义聚合函数,多进一出。类似于count/max/min 1.3 UDTF(User-Defined Table-Generating Functions) 用户自定义表生成函数,一进多出。如lateral view explode()
暴躁小师兄数据学院
5 天前
大数据
·
hadoop
·
flink
·
spark
【AI大数据工程师特训笔记】第15讲:大数据环境安装
目录第一章:WSL 与 Java 环境安装第二章:Hadoop 安装与配置第三章:Hive 安装与配置
王小王-123
5 天前
hadoop
·
数据分析
·
flask
·
电动汽车
·
新能源汽车数据分析
·
新能源汽车销量分析
·
新能源汽车销售分析
基于 Hadoop + Flask 的电动汽车数据分析与可视化系统设计与实现
目录1 项目简介2 项目背景与应用场景3 项目整体功能介绍4 技术路线与开发环境5 系统功能模块展示5.1 数据采集与预处理模块
王小王-123
5 天前
hadoop
·
机器学习
·
数据分析
·
心脏病预测
基于机器学习与Hadoop的心脏病数据分析与可视化设计与实现
有需要本项目的代码或文档以及全部资源,或者部署调试可以私信博主图1 项目封面效果一、项目整体介绍这套项目围绕心脏病健康数据展开,从原始数据整理、字段清洗、统计聚合、模型预测到可视化大屏呈现,形成了一条比较完整的数据挖掘实践链路。数据字段覆盖 BMI、吸烟、饮酒、中风、身体健康天数、精神健康天数、行走困难、年龄段、糖尿病、总体健康、睡眠时长、哮喘、肾病、皮肤癌等多个维度,既能做基础统计,也能继续向机器学习预测方向扩展。
知识分享小能手
5 天前
大数据
·
hadoop
·
学习
Hadoop学习教程,从入门到精通, Hadoop 3.x 高可用集群 — 知识点详解(6)
核心知识点:在 Hadoop 1.x 中,NameNode 存在单点故障(SPOF)。HDFS HA 通过配置 Active/Standby 两个 NameNode 来解决此问题。
知识分享小能手
6 天前
hadoop
·
分布式
·
zookeeper
Hadoop学习教程,从入门到精通, ZooKeeper 分布式协调服务 — 全面知识点与案例代码(5)
ZooKeeper 是 Apache 软件基金会的一个开源项目,最初由 Google 的 Chubby 论文启发而来。它是一个分布式的、开放源码的分布式应用程序协调服务,是 Google Chubby 的一个开源实现。
知识分享小能手
7 天前
hadoop
·
学习
·
mapreduce
Hadoop学习教程,从入门到精通, MapReduce分布式计算框架 — 完整知识点与代码案例(4)
MapReduce是Hadoop的核心组件之一,是一种分布式并行编程模型,用于大规模数据集(大于1TB)的并行运算。它将复杂的、运行于大规模集群上的并行计算过程高度抽象为两个函数:Map(映射) 和 Reduce(归约)。
白日与明月
7 天前
数据仓库
·
hive
·
hadoop
Hive子查询中的ORDER BY陷阱:为什么排序“消失”了?
今日和同事争论了片刻,背景是这样的, 有个客户写了一个SQL, 然后其中需要进行排序, 但是写了Order by, 但是排序没有生效. 然后我就尝试了下, 果然,在大数据平台里执行,是报错的. 但是在beeline执行, 查询结果是正常的, 所以就怀疑研发写了一个BUG, 于是就开始争论. SQL很简单,简写为
段一凡-华北理工大学
7 天前
大数据
·
人工智能
·
hadoop
·
分布式
·
学习
·
架构
·
高炉炼铁
工业领域的Hadoop架构学习~系列文章24:adoop工业应用总结与展望 - 技术路线图与最佳实践
导言:作为专栏的收官之作,本期对《工业领域的Hadoop架构学习》进行系统性总结,回顾核心技术要点,提炼最佳实践经验,并展望未来的技术发展方向,为读者提供完整的技术路线图和持续学习指南。