hadoop

大数据基础21 小时前
大数据·vue.js·hadoop·spring boot·数据分析·maven·mapreduce
基于 Hadoop MapReduce + Spring Boot + Vue 3 的每日饮水数据分析平台本文详细介绍一个完整的大数据分析项目,从数据采集、MapReduce 分析处理到前端可视化展示的全流程实现。项目采用 Hadoop MapReduce 进行大数据分析,Spring Boot 提供 RESTful API,Vue 3 + ECharts 实现数据可视化。
workflower1 天前
java·hadoop·nosql·需求分析·big data·结对编程
多变量时间序列预测“多变量时间序列预测(Multivariate Time Series Forecasting)” 和 “带有外生变量的时间序列预测(Time Series Forecasting with Exogenous Variables)” 两大研究主题。根据具体建模方式和问题语境,还可以进一步细分为动态回归(Dynamic Regression)、VARX 模型、条件预测(Conditional Forecasting) 等。下面从概念、经典方法、现代方法以及实际意义四个方面为你梳理。
docsz2 天前
hadoop
Rocky Linux 9.4部署Hadoop 3.4.2 高可用集群注:每个节点都要按配置文件修改
礼拜天没时间.2 天前
linux·hadoop·分布式·docker·容器
Docker 部署分布式 Hadoop(超详细实战版)在传统方式下部署 Hadoop:需要准备多台虚拟机手动配置网络、主机名、SSH 免密重复安装 JDK、Hadoop
xutSwIpZotzM3 天前
hadoop
量产HX711电子秤采集模块全套资料,包含原理图、PCB文件、BOM以及源码HEX,支持串口波...电子秤实物量产资料 原理图和PCB文件及BOM,源码HEX 量产HX711电子秤采集模块全套资料 1.串口波特率19200; 2.上电后直接串口打印称重数据; 3.可以发指令校零传感器,读取称重数值; 4.默认使用的是40Kg的传感器,其它传感器需要重新修正参数; 5.有看门狗功能,减少程序异常; 6.STM8F103驱动HX711 包含原理图和PCB及源码(详细注释代码)。
小邓睡不饱耶3 天前
hadoop·hdfs·spark
Hadoop 3.x实战:基于HDFS+Spark+Flink的实时用户行为分析平台(含Kerberos安全配置+冷热数据分层)在大数据实时化、安全合规要求升级的当下,传统Hadoop集群面临“实时处理弱、安全防护不足、存储成本高”三大痛点。本文基于 Hadoop 3.3.6(最新稳定版),设计一套“离线批处理+实时流计算”一体化的用户行为分析平台,整合HDFS 3.x、Spark 3.4.1、Flink 1.17.0核心组件,融入Kerberos身份认证、HDFS冷热数据分层、列式存储优化等企业级特性,全程拆解从集群部署到业务落地的完整流程,附关键配置与代码实现,可直接适配电商、短视频等场景的用户行为分析需求。
Francek Chen5 天前
大数据·hadoop·分布式·hdfs·架构
【大数据存储与管理】分布式文件系统HDFS:01 分布式文件系统【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈大数据技术原理与应用 ⌋ ⌋ ⌋专栏系统介绍大数据的相关知识,分为大数据基础篇、大数据存储与管理篇、大数据处理与分析篇、大数据应用篇。内容包含大数据概述、大数据处理架构Hadoop、分布式文件系统HDFS、分布式数据库HBase、NoSQL数据库、云数据库、MapReduce、Hadoop再探讨、数据仓库Hive、Spark、流计算、Flink、图计算、数据可视化,以及大数据在互联网领域、生物医学领域的应用和大数据的其他应用。 【GitCode
旺仔Sec5 天前
hive·hadoop·mysql
手把手教你从零搭建 Hive 2.3.6 + MySQL 元数据存储(含视频教程)Apache Hive 是一个基于 Hadoop 的数据仓库工具,最初由 Facebook 开发,后捐赠给 Apache 基金会。它允许用户使用类似 SQL 的查询语言(称为 HiveQL 或 HQL)来读取、写入和管理存储在 Hadoop 分布式文件系统(HDFS)中的大规模结构化数据集。
vmnfPZtzOv6 天前
hadoop
蜣螂优化LSSVM参数实战蜣螂优化算法DBO优化LSSVM的c和g参数做多特征输入单输出的二分类及多分类模型。 程序内注释详细替换数据就可以用。 程序语言为matlab。 程序可出分类效果图,迭代优化图,混淆矩阵图具体效果如下所示。
人道领域6 天前
数据仓库·hive·hadoop
SSM框架从入门到入土(SpringMVC入门开发全流程解析)目录入门案例步骤:注解解释:SpringMVC入门程序开发总结(1+N)注意:SpringMVC专用设置请求路径(固定格式)
qq_12498707536 天前
人工智能·hadoop·信息可视化·微信小程序·小程序·毕业设计·娱乐
基于微信小程序的智慧社区娱乐服务管理平台(源码+论文+部署+安装)传统社区娱乐服务管理存在资源分散、管理效率低、居民参与便捷性不足、邻里互动匮乏等问题,难以满足居民多样化娱乐需求和社区精细化管理诉求。随着智慧社区建设推进,微信小程序凭借 “无需下载、即开即用” 的便捷性,成为连接居民与社区服务的重要载体。基于此,本研究构建基于微信小程序的智慧社区娱乐服务管理平台,整合社区娱乐资源,运用信息化、智能化技术,化解传统管理痛点,提升居民生活质量与社区凝聚力,推动社区管理服务向信息化、智能化转型。
火龙谷6 天前
数据仓库·hive·hadoop
【hadoop】Hive数据仓库安装部署换源:最下面附加部分 1、在master上直接使用yum命令在线安装MySQL数据库:途中会询问是否继续,输入Y并按回车。
what丶k6 天前
大数据·hadoop
Hadoop 实战详解:从环境搭建到企业级案例落地在大数据爆发的时代,PB 级数据的存储与计算成为企业数字化转型的核心需求,而 Hadoop 作为 Apache 开源的分布式大数据框架,凭借高可用性、可扩展性、高容错性和低成本的优势,成为处理海量数据的行业标准。不同于纯理论讲解,本文聚焦Hadoop 实战核心,从环境搭建、核心组件实操、综合案例落地到常见问题排查,全程干货无冗余,助力开发者快速上手,将 Hadoop 技术落地到实际业务场景中。
lhxsir6 天前
数据仓库·hive·hadoop
HIVE表结构和注释#获取hive表字段和注释通过登录hive元数据库(mysql),查询SQL:SELECT t.TBL_NAME AS table_name, p.PARAM_VALUE AS table_comment, c.COLUMN_NAME AS column_name, c.TYPE_NAME AS data_type, c.COMMENT AS column_comment FROM TBLS t JOIN TABLE_PARAMS p ON t.TBL_ID = p.TBL_ID AND p.PARAM_
sunxunyong7 天前
hadoop
bg存储配置Name Quotas:限制目录下文件和目录的总数量。计算范围包含该目录下所有层级的文件和子目录。 hdfs dfsadmin -setQuota 10000 目录本身也算一个额度,因此设置配额为1会使该目录保持空目录状态。 hdfs dfsadmin -setQuota 10000 apps/hive/warehouse/bg_u.db Space Quotas:限制目录下所有文件占用的总字节数。文件的所有副本都会计入额度。 hdfs dfsadmin -setSpaceQuota 1073741824
qq_12498707537 天前
大数据·hadoop·spring boot·分布式·信息可视化·微信小程序·小程序
基于微信小程序的云浮市特色农产品交易的设计与实现(源码+论文+部署+安装)随着互联网普及与智能手机的广泛应用,微信小程序凭借无需下载安装、操作便捷、用户基数庞大的优势,成为移动应用的重要载体。我国作为农业大国,云浮市特色农产品种类丰富,但传统销售模式存在渠道单一、信息不对称、物流成本高、中间环节繁琐等痛点,导致农产品销售效率低下,农民增收缓慢,优质特色农产品难以高效触达消费者。在此背景下,为拓宽云浮市特色农产品销售渠道、降低运营成本、提升产品市场竞争力,助力乡村振兴战略实施,依托 Java、Spring Boot、MySQL 等成熟技术,开发基于微信小程序的云浮市特色农产品交易
我要用代码向我喜欢的女孩表白7 天前
数据仓库·hive·hadoop
hive高阶,了解hive相关问题,面试1.hive常见问题,数据倾斜是什么? 数据倾斜指的是,数据分布不均匀,有两种情况Map不均匀和Reduce不均匀。如何发现的?打开hive-ui,可以发现某一个Map任务耗时远超其他的Map任务,此时没有特别好的手段,若是hiveSql,可以group by 这个key,看一下是哪个,对他进行业务上的拆分。Reduce的发现是卡在99%,其他的reduce都完成了,看一下Task处理数量,可以开启group by聚合,map端预聚合是默认开启的,看一下reduce日志,oom,还是节点挂了,观察他的sq
潘达斯奈基~7 天前
hadoop·docker·flink
Docker部署Hadoop+Flink集群最近在学习Flink,想自己学课程,做项目实践下,于是搭建Flink集群,之前使用虚拟机搭建过Hadoop集群,现在我想使用Docker来部署Hadoop和Flink,正好可以回顾下Docker、Hadoop,学习Flink。
无级程序员8 天前
大数据·hive·hadoop
大数据Hive之拉链表增量取数合并设计(主表加历史表合并成拉链表)我们mysql有一个大表,千万级数据量,另外为它做了一张历史表,保留历史数据(只保留一个月)。如下图所示: 主表: 历史表: 而数据中台的表结构如下: