hadoop

Francek Chen2 天前
大数据·hadoop·分布式·hdfs·架构
【大数据存储与管理】分布式文件系统HDFS:01 分布式文件系统【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈大数据技术原理与应用 ⌋ ⌋ ⌋专栏系统介绍大数据的相关知识,分为大数据基础篇、大数据存储与管理篇、大数据处理与分析篇、大数据应用篇。内容包含大数据概述、大数据处理架构Hadoop、分布式文件系统HDFS、分布式数据库HBase、NoSQL数据库、云数据库、MapReduce、Hadoop再探讨、数据仓库Hive、Spark、流计算、Flink、图计算、数据可视化,以及大数据在互联网领域、生物医学领域的应用和大数据的其他应用。 【GitCode
旺仔Sec2 天前
hive·hadoop·mysql
手把手教你从零搭建 Hive 2.3.6 + MySQL 元数据存储(含视频教程)Apache Hive 是一个基于 Hadoop 的数据仓库工具,最初由 Facebook 开发,后捐赠给 Apache 基金会。它允许用户使用类似 SQL 的查询语言(称为 HiveQL 或 HQL)来读取、写入和管理存储在 Hadoop 分布式文件系统(HDFS)中的大规模结构化数据集。
vmnfPZtzOv3 天前
hadoop
蜣螂优化LSSVM参数实战蜣螂优化算法DBO优化LSSVM的c和g参数做多特征输入单输出的二分类及多分类模型。 程序内注释详细替换数据就可以用。 程序语言为matlab。 程序可出分类效果图,迭代优化图,混淆矩阵图具体效果如下所示。
人道领域3 天前
数据仓库·hive·hadoop
SSM框架从入门到入土(SpringMVC入门开发全流程解析)目录入门案例步骤:注解解释:SpringMVC入门程序开发总结(1+N)注意:SpringMVC专用设置请求路径(固定格式)
qq_12498707533 天前
人工智能·hadoop·信息可视化·微信小程序·小程序·毕业设计·娱乐
基于微信小程序的智慧社区娱乐服务管理平台(源码+论文+部署+安装)传统社区娱乐服务管理存在资源分散、管理效率低、居民参与便捷性不足、邻里互动匮乏等问题,难以满足居民多样化娱乐需求和社区精细化管理诉求。随着智慧社区建设推进,微信小程序凭借 “无需下载、即开即用” 的便捷性,成为连接居民与社区服务的重要载体。基于此,本研究构建基于微信小程序的智慧社区娱乐服务管理平台,整合社区娱乐资源,运用信息化、智能化技术,化解传统管理痛点,提升居民生活质量与社区凝聚力,推动社区管理服务向信息化、智能化转型。
火龙谷3 天前
数据仓库·hive·hadoop
【hadoop】Hive数据仓库安装部署换源:最下面附加部分 1、在master上直接使用yum命令在线安装MySQL数据库:途中会询问是否继续,输入Y并按回车。
what丶k3 天前
大数据·hadoop
Hadoop 实战详解:从环境搭建到企业级案例落地在大数据爆发的时代,PB 级数据的存储与计算成为企业数字化转型的核心需求,而 Hadoop 作为 Apache 开源的分布式大数据框架,凭借高可用性、可扩展性、高容错性和低成本的优势,成为处理海量数据的行业标准。不同于纯理论讲解,本文聚焦Hadoop 实战核心,从环境搭建、核心组件实操、综合案例落地到常见问题排查,全程干货无冗余,助力开发者快速上手,将 Hadoop 技术落地到实际业务场景中。
lhxsir3 天前
数据仓库·hive·hadoop
HIVE表结构和注释#获取hive表字段和注释通过登录hive元数据库(mysql),查询SQL:SELECT t.TBL_NAME AS table_name, p.PARAM_VALUE AS table_comment, c.COLUMN_NAME AS column_name, c.TYPE_NAME AS data_type, c.COMMENT AS column_comment FROM TBLS t JOIN TABLE_PARAMS p ON t.TBL_ID = p.TBL_ID AND p.PARAM_
sunxunyong4 天前
hadoop
bg存储配置Name Quotas:限制目录下文件和目录的总数量。计算范围包含该目录下所有层级的文件和子目录。 hdfs dfsadmin -setQuota 10000 目录本身也算一个额度,因此设置配额为1会使该目录保持空目录状态。 hdfs dfsadmin -setQuota 10000 apps/hive/warehouse/bg_u.db Space Quotas:限制目录下所有文件占用的总字节数。文件的所有副本都会计入额度。 hdfs dfsadmin -setSpaceQuota 1073741824
qq_12498707534 天前
大数据·hadoop·spring boot·分布式·信息可视化·微信小程序·小程序
基于微信小程序的云浮市特色农产品交易的设计与实现(源码+论文+部署+安装)随着互联网普及与智能手机的广泛应用,微信小程序凭借无需下载安装、操作便捷、用户基数庞大的优势,成为移动应用的重要载体。我国作为农业大国,云浮市特色农产品种类丰富,但传统销售模式存在渠道单一、信息不对称、物流成本高、中间环节繁琐等痛点,导致农产品销售效率低下,农民增收缓慢,优质特色农产品难以高效触达消费者。在此背景下,为拓宽云浮市特色农产品销售渠道、降低运营成本、提升产品市场竞争力,助力乡村振兴战略实施,依托 Java、Spring Boot、MySQL 等成熟技术,开发基于微信小程序的云浮市特色农产品交易
我要用代码向我喜欢的女孩表白4 天前
数据仓库·hive·hadoop
hive高阶,了解hive相关问题,面试1.hive常见问题,数据倾斜是什么? 数据倾斜指的是,数据分布不均匀,有两种情况Map不均匀和Reduce不均匀。如何发现的?打开hive-ui,可以发现某一个Map任务耗时远超其他的Map任务,此时没有特别好的手段,若是hiveSql,可以group by 这个key,看一下是哪个,对他进行业务上的拆分。Reduce的发现是卡在99%,其他的reduce都完成了,看一下Task处理数量,可以开启group by聚合,map端预聚合是默认开启的,看一下reduce日志,oom,还是节点挂了,观察他的sq
潘达斯奈基~4 天前
hadoop·docker·flink
Docker部署Hadoop+Flink集群最近在学习Flink,想自己学课程,做项目实践下,于是搭建Flink集群,之前使用虚拟机搭建过Hadoop集群,现在我想使用Docker来部署Hadoop和Flink,正好可以回顾下Docker、Hadoop,学习Flink。
无级程序员5 天前
大数据·hive·hadoop
大数据Hive之拉链表增量取数合并设计(主表加历史表合并成拉链表)我们mysql有一个大表,千万级数据量,另外为它做了一张历史表,保留历史数据(只保留一个月)。如下图所示: 主表: 历史表: 而数据中台的表结构如下:
qq_12498707535 天前
大数据·人工智能·hadoop·分布式·信息可视化·毕业设计·计算机毕业设计
基于Hadoop的信贷风险评估的数据可视化分析与预测系统的设计与实现(源码+论文+部署+安装)随着社会经济快速发展,信贷业务规模持续扩大,信贷风险(尤其是信用风险)的识别、评估与控制难度日益增加,传统人工评估方式已无法满足现代金融机构的风控需求。数据可视化分析与预测技术的兴起,为信贷风控提供了新的解决方案——通过将复杂信贷数据直观呈现,结合数据分析与预测模型,可实现信贷风险的前瞻性评估。在此背景下,基于Java语言,融合Hadoop大数据处理技术、Spring Boot框架及MySQL数据库,开发一套信贷风险评估的数据可视化分析与预测系统,助力金融机构提升风控效率与准确性,减少不良贷款损失,保障信
十月南城5 天前
数据仓库·hive·hadoop
Hive与离线数仓方法论——分层建模、分区与桶的取舍与查询代价写在前面,本人目前处于求职中,如有合适内推岗位,请加:lpshiyue 感谢。优秀的离线数据仓库不是数据的简单堆积,而是分层架构、分区策略与分桶技术精密平衡的艺术品
B站计算机毕业设计超人6 天前
大数据·hive·hadoop·python·spark·毕业设计·课程设计
计算机毕业设计Hadoop+Spark+Hive招聘推荐系统 招聘大数据分析 大数据毕业设计(源码+文档+PPT+ 讲解)温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片!温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片!
B站计算机毕业设计超人6 天前
大数据·hive·hadoop·python·spark·毕业设计·课程设计
计算机毕业设计hadoop+spark+hive交通拥堵预测 交通流量预测 智慧城市交通大数据 交通客流量分析(源码+LW文档+PPT+讲解视频)温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片!温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片!
AI架构师小马6 天前
数据仓库·hive·hadoop·ai
Hive调优手册:从入门到精通的完整指南关键词:Hive调优、性能优化、Hadoop、数据仓库、MapReduce、SQL优化摘要:本文旨在为读者提供一份全面且深入的Hive调优指南,从基础概念到高级优化技巧,涵盖了Hive调优的各个方面。通过详细介绍核心概念、算法原理、数学模型以及丰富的实战案例,帮助读者理解Hive调优的本质和方法。同时,文章还推荐了相关的学习资源、开发工具和论文著作,为读者进一步深入学习和实践提供了方向。最后,对Hive调优的未来发展趋势和挑战进行了总结和展望。
数据架构师的AI之路6 天前
大数据·hive·hadoop·ai
深入了解大数据领域Hive的HQL语言特性关键词:Hive、HQL、大数据查询、分区表、元数据、MapReduce、UDF摘要:本文将带你像拆积木一样拆解大数据领域的“查询利器”HiveQL(简称HQL)。我们会从HQL的诞生背景讲起,用“图书馆借书”“超市货架”等生活化案例解释核心概念,对比传统SQL揭示HQL的独特设计,通过代码实战演示如何用HQL分析亿级用户行为数据,并探讨HQL在实时化、云原生等方向的未来趋势。无论你是大数据新手还是想深入理解HQL底层逻辑的开发者,读完本文都能对HQL的“能与不能”有清晰认知。