hadoop

数据知道2 天前
hadoop·postgresql·spark
PostgreSQL:详解 PostgreSQL 与Hadoop与Spark的集成在现代数据架构中,PostgreSQL 作为功能强大的 OLTP(在线事务处理)和轻量级 OLAP(在线分析处理)数据库,常需与 Hadoop 生态(HDFS、Hive、HBase)和 Apache Spark(大规模分布式计算引擎)协同工作,以构建完整的 Lambda/Kappa 架构 或 混合事务/分析处理(HTAP)平台。
Francek Chen2 天前
大数据·hadoop·分布式·hdfs
【大数据存储与管理】分布式文件系统HDFS:03 HDFS的相关概念【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈大数据技术原理与应用 ⌋ ⌋ ⌋专栏系统介绍大数据的相关知识,分为大数据基础篇、大数据存储与管理篇、大数据处理与分析篇、大数据应用篇。内容包含大数据概述、大数据处理架构Hadoop、分布式文件系统HDFS、分布式数据库HBase、NoSQL数据库、云数据库、MapReduce、Hadoop再探讨、数据仓库Hive、Spark、流计算、Flink、图计算、数据可视化,以及大数据在互联网领域、生物医学领域的应用和大数据的其他应用。 【GitCode
Timer_Cooker3 天前
数据仓库·hive·hadoop
Hive Sum(null)编译报错分析业务需求需要使用hive统计积分point字段,不假思索写上了sum(point)的字段映射,造数null,空格串,空串,数字字符串,含有字母的数字串,结果符合预期。如图:
之歆4 天前
大数据·hadoop·mapreduce
Hadoop MapReduce 详解想象一个巨大的文档分类任务,一个人处理要一个月。MapReduce 把这个任务分配给一百个人,每人处理一小部分,最后把结果汇总,半小时就完成了!这就是 MapReduce 的威力!
大数据基础5 天前
大数据·vue.js·hadoop·spring boot·数据分析·maven·mapreduce
基于 Hadoop MapReduce + Spring Boot + Vue 3 的每日饮水数据分析平台本文详细介绍一个完整的大数据分析项目,从数据采集、MapReduce 分析处理到前端可视化展示的全流程实现。项目采用 Hadoop MapReduce 进行大数据分析,Spring Boot 提供 RESTful API,Vue 3 + ECharts 实现数据可视化。
workflower5 天前
java·hadoop·nosql·需求分析·big data·结对编程
多变量时间序列预测“多变量时间序列预测(Multivariate Time Series Forecasting)” 和 “带有外生变量的时间序列预测(Time Series Forecasting with Exogenous Variables)” 两大研究主题。根据具体建模方式和问题语境,还可以进一步细分为动态回归(Dynamic Regression)、VARX 模型、条件预测(Conditional Forecasting) 等。下面从概念、经典方法、现代方法以及实际意义四个方面为你梳理。
docsz6 天前
hadoop
Rocky Linux 9.4部署Hadoop 3.4.2 高可用集群注:每个节点都要按配置文件修改
礼拜天没时间.6 天前
linux·hadoop·分布式·docker·容器
Docker 部署分布式 Hadoop(超详细实战版)在传统方式下部署 Hadoop:需要准备多台虚拟机手动配置网络、主机名、SSH 免密重复安装 JDK、Hadoop
xutSwIpZotzM7 天前
hadoop
量产HX711电子秤采集模块全套资料,包含原理图、PCB文件、BOM以及源码HEX,支持串口波...电子秤实物量产资料 原理图和PCB文件及BOM,源码HEX 量产HX711电子秤采集模块全套资料 1.串口波特率19200; 2.上电后直接串口打印称重数据; 3.可以发指令校零传感器,读取称重数值; 4.默认使用的是40Kg的传感器,其它传感器需要重新修正参数; 5.有看门狗功能,减少程序异常; 6.STM8F103驱动HX711 包含原理图和PCB及源码(详细注释代码)。
小邓睡不饱耶7 天前
hadoop·hdfs·spark
Hadoop 3.x实战:基于HDFS+Spark+Flink的实时用户行为分析平台(含Kerberos安全配置+冷热数据分层)在大数据实时化、安全合规要求升级的当下,传统Hadoop集群面临“实时处理弱、安全防护不足、存储成本高”三大痛点。本文基于 Hadoop 3.3.6(最新稳定版),设计一套“离线批处理+实时流计算”一体化的用户行为分析平台,整合HDFS 3.x、Spark 3.4.1、Flink 1.17.0核心组件,融入Kerberos身份认证、HDFS冷热数据分层、列式存储优化等企业级特性,全程拆解从集群部署到业务落地的完整流程,附关键配置与代码实现,可直接适配电商、短视频等场景的用户行为分析需求。
Francek Chen9 天前
大数据·hadoop·分布式·hdfs·架构
【大数据存储与管理】分布式文件系统HDFS:01 分布式文件系统【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈大数据技术原理与应用 ⌋ ⌋ ⌋专栏系统介绍大数据的相关知识,分为大数据基础篇、大数据存储与管理篇、大数据处理与分析篇、大数据应用篇。内容包含大数据概述、大数据处理架构Hadoop、分布式文件系统HDFS、分布式数据库HBase、NoSQL数据库、云数据库、MapReduce、Hadoop再探讨、数据仓库Hive、Spark、流计算、Flink、图计算、数据可视化,以及大数据在互联网领域、生物医学领域的应用和大数据的其他应用。 【GitCode
旺仔Sec9 天前
hive·hadoop·mysql
手把手教你从零搭建 Hive 2.3.6 + MySQL 元数据存储(含视频教程)Apache Hive 是一个基于 Hadoop 的数据仓库工具,最初由 Facebook 开发,后捐赠给 Apache 基金会。它允许用户使用类似 SQL 的查询语言(称为 HiveQL 或 HQL)来读取、写入和管理存储在 Hadoop 分布式文件系统(HDFS)中的大规模结构化数据集。
vmnfPZtzOv10 天前
hadoop
蜣螂优化LSSVM参数实战蜣螂优化算法DBO优化LSSVM的c和g参数做多特征输入单输出的二分类及多分类模型。 程序内注释详细替换数据就可以用。 程序语言为matlab。 程序可出分类效果图,迭代优化图,混淆矩阵图具体效果如下所示。
人道领域10 天前
数据仓库·hive·hadoop
SSM框架从入门到入土(SpringMVC入门开发全流程解析)目录入门案例步骤:注解解释:SpringMVC入门程序开发总结(1+N)注意:SpringMVC专用设置请求路径(固定格式)
qq_124987075310 天前
人工智能·hadoop·信息可视化·微信小程序·小程序·毕业设计·娱乐
基于微信小程序的智慧社区娱乐服务管理平台(源码+论文+部署+安装)传统社区娱乐服务管理存在资源分散、管理效率低、居民参与便捷性不足、邻里互动匮乏等问题,难以满足居民多样化娱乐需求和社区精细化管理诉求。随着智慧社区建设推进,微信小程序凭借 “无需下载、即开即用” 的便捷性,成为连接居民与社区服务的重要载体。基于此,本研究构建基于微信小程序的智慧社区娱乐服务管理平台,整合社区娱乐资源,运用信息化、智能化技术,化解传统管理痛点,提升居民生活质量与社区凝聚力,推动社区管理服务向信息化、智能化转型。
火龙谷10 天前
数据仓库·hive·hadoop
【hadoop】Hive数据仓库安装部署换源:最下面附加部分 1、在master上直接使用yum命令在线安装MySQL数据库:途中会询问是否继续,输入Y并按回车。
what丶k10 天前
大数据·hadoop
Hadoop 实战详解:从环境搭建到企业级案例落地在大数据爆发的时代,PB 级数据的存储与计算成为企业数字化转型的核心需求,而 Hadoop 作为 Apache 开源的分布式大数据框架,凭借高可用性、可扩展性、高容错性和低成本的优势,成为处理海量数据的行业标准。不同于纯理论讲解,本文聚焦Hadoop 实战核心,从环境搭建、核心组件实操、综合案例落地到常见问题排查,全程干货无冗余,助力开发者快速上手,将 Hadoop 技术落地到实际业务场景中。
lhxsir10 天前
数据仓库·hive·hadoop
HIVE表结构和注释#获取hive表字段和注释通过登录hive元数据库(mysql),查询SQL:SELECT t.TBL_NAME AS table_name, p.PARAM_VALUE AS table_comment, c.COLUMN_NAME AS column_name, c.TYPE_NAME AS data_type, c.COMMENT AS column_comment FROM TBLS t JOIN TABLE_PARAMS p ON t.TBL_ID = p.TBL_ID AND p.PARAM_
sunxunyong11 天前
hadoop
bg存储配置Name Quotas:限制目录下文件和目录的总数量。计算范围包含该目录下所有层级的文件和子目录。 hdfs dfsadmin -setQuota 10000 目录本身也算一个额度,因此设置配额为1会使该目录保持空目录状态。 hdfs dfsadmin -setQuota 10000 apps/hive/warehouse/bg_u.db Space Quotas:限制目录下所有文件占用的总字节数。文件的所有副本都会计入额度。 hdfs dfsadmin -setSpaceQuota 1073741824