hadoop

大鳥1 小时前
hive·hadoop
数据仓库知识体系### 第一章:数据仓库是什么
计算机毕业编程指导师2 小时前
大数据·hadoop·python·计算机·spark·毕业设计·城市交通
大数据可视化毕设:Hadoop+Spark交通分析系统从零到上线 毕业设计 选题推荐 毕设选题 数据分析 机器学习 数据挖掘⭐⭐个人介绍:自己非常喜欢研究技术问题!专业做Java、Python、小程序、安卓、大数据、爬虫、Golang、大屏等实战项目。 ⛽⛽实战项目:有源码或者技术上的问题欢迎在评论区一起讨论交流! ⚡⚡有什么问题可以在主页上或文末下联系咨询博客~~ ⚡⚡Java、Python、小程序、大数据实战项目集](https://blog.csdn.net/2301_80395604/category_12487856.html)
计算机毕业编程指导师2 小时前
大数据·hadoop·python·计算机·spark·毕业设计·车辆排放
【计算机毕设选题】基于Spark的车辆排放分析:2026年热门大数据项目 毕业设计 选题推荐 毕设选题 数据分析 机器学习 数据挖掘⭐⭐个人介绍:自己非常喜欢研究技术问题!专业做Java、Python、小程序、安卓、大数据、爬虫、Golang、大屏等实战项目。 ⛽⛽实战项目:有源码或者技术上的问题欢迎在评论区一起讨论交流! ⚡⚡有什么问题可以在主页上或文末下联系咨询博客~~ ⚡⚡Java、Python、小程序、大数据实战项目集](https://blog.csdn.net/2301_80395604/category_12487856.html)
talle20212 小时前
数据仓库·hive·hadoop
Hive | 行列转换concat函数用于实现字符串拼接,不可指定分隔符。如果任意一个元素为null,结果就为null。concat_ws函数用于实现字符串拼接,可以指定分隔符。任意一个元素不为null,结果就不为null。
talle20214 小时前
hive·hadoop·json
Hive | json数据处理JSON格式的数据如下,JSON格式对引号要求比较高,如果key或者value是字符串类型的,只能使用双引号引起来。
CTO Plus技术服务中4 小时前
数据仓库·hive·hadoop
Hive开发与运维教程这部分的内容我们已经全部开放到了平台上,后面随着情况还会持续更新和调整新的内容,再继续持续完善,有问题欢迎后台留言咨询。
ha_lydms6 小时前
大数据·hadoop·hdfs·架构·mapreduce·yarn·数据处理
Hadoop 架构高可靠性:Hadoop底层维护多个数据副本,所以即使Hadoop某个计算元素或存储出现故障,也不会导致数据的丢失。
小邓睡不饱耶21 小时前
hive·hadoop·sqoop
Sqoop 实战:数据迁移核心案例、优化技巧与企业级落地在大数据生态中,“数据孤岛”是企业普遍面临的痛点——业务数据存储在 MySQL、Oracle 等关系型数据库,而大数据分析依赖 Hadoop 生态(HDFS、Hive、HBase)。此时,Sqoop(SQL-to-Hadoop) 作为打通关系型数据库与 Hadoop 生态的数据迁移利器,成为连接结构化数据与大数据分析的核心桥梁。
沃达德软件1 天前
数据仓库·人工智能·hive·hadoop·redis·hbase
重点人员动态管控系统解析治安重点人员动态管控,针对七类重点人员进行管控,以动态研判和动态管控为出发点,以“一人一档”方式,建立反映重点人员动态管控全过程的“电子档案库”。重点人员动态管控,集中展现重点人员的基础信息、动态信息、管控信息、现实表现信息。通过重点人员在不同时间、不同地域范围的行为轨迹、活动规律和可能异常动向,有效筛选违法犯罪嫌疑度高和危害性大的重点人员,采取分类管控措施,提高重点人员预警的科学性、高效性。 #智慧警务#大数据#大数据分析#大数据平台#数据建模
ruxshui1 天前
hive·hadoop·笔记
个人笔记: 星环Inceptor/hive普通分区表与范围分区表核心技术总结通过「普通分区表+统一字符串格式+范围查询」实现等效效果,是数仓主流兼容方案:无特殊范围查询需求时,优先选择普通分区表(兼容性好、支持多列分区、适配多场景); Inceptor4.0+版本且满足以下条件时,选择范围分区表:
TTBIGDATA2 天前
大数据·hadoop·ambari·hdp·国产化·hue·bigtop
【Hue 】Hue 访问 YARN 返回 403 权限问题我们的大数据平台代码已经开源 >>>>> TTbigdata在 Ambari + Bigtop 环境中完成 Hue 安装后,通过 Hue 查看 YARN 应用列表 或相关资源页面,页面无法正常加载。
TTBIGDATA2 天前
大数据·运维·前端·hadoop·ui·ambari·hdp
【Knox】Knox 转发访问 Trino Web UI 返回 406 错误的原因与处理在 Knox 已完成接入、并通过 Knox 访问 Trino Web UI 时,点击页面链接后直接返回 406 错误:
小邓睡不饱耶2 天前
大数据·hadoop·架构
Hadoop:从架构原理到企业级实战,大数据处理入门到精通在大数据时代,面对TB级甚至PB级的海量数据,传统单机数据处理方案早已力不从心。而 Hadoop 作为分布式大数据处理的基石,凭借其高可靠性、高扩展性、高容错性的核心优势,成为企业处理海量数据的首选框架。
Francek Chen2 天前
大数据·hadoop·分布式·架构
【大数据基础】大数据处理架构Hadoop:03 Hadoop的安装与使用【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈大数据技术原理与应用 ⌋ ⌋ ⌋专栏系统介绍大数据的相关知识,分为大数据基础篇、大数据存储与管理篇、大数据处理与分析篇、大数据应用篇。内容包含大数据概述、大数据处理架构Hadoop、分布式文件系统HDFS、分布式数据库HBase、NoSQL数据库、云数据库、MapReduce、Hadoop再探讨、数据仓库Hive、Spark、流计算、Flink、图计算、数据可视化,以及大数据在互联网领域、生物医学领域的应用和大数据的其他应用。 【GitCode
小邓睡不饱耶2 天前
大数据·hadoop·分布式
Hadoop 进阶:企业级项目实战、生态深度整合与故障排查在上一篇博客中,我们掌握了 Hadoop 的核心架构、环境搭建、基础组件操作与性能优化,能够满足入门级大数据处理需求。但企业级应用中,Hadoop 并非孤立运行——需整合生态工具解决复杂场景(如实时数据采集、数据仓库构建、海量日志分析),还需应对集群运维、故障处理、多场景数据处理等工程化问题。
小邓睡不饱耶2 天前
大数据·hadoop·分布式
深耕 Hadoop:内核优化、分布式一致性与大规模集群实战在前两篇博客中,我们已掌握 Hadoop 生态的核心组件、企业级项目落地、生态整合与运维排查,能够应对常规大数据场景。但在超大规模集群(千节点级)、高并发实时场景、极致性能要求下,仅停留在“会用”层面远远不够——需要穿透组件内核,理解分布式一致性原理,掌握底层优化技巧,才能解决企业级核心痛点。
weixin_462446233 天前
hive·hadoop·mysql
Hive Metastore 使用 MySQL 8(CJ 驱动)完整配置实战(含完整 Shell 脚本)本文通过 一份可直接运行的 Shell 脚本,完成 Hive Metastore 在 MySQL 8 上的创建、配置、驱动替换和 schema 初始化,适合生产与集群环境。
zhangkaixuan4564 天前
大数据·hadoop·flink·apache·paimon
Paimon 读取数据流程深度解析📌 重要提示:本文档系统性地区分了主键表和非主键表的处理流程。建议先阅读《Paimon 主键表 vs 非主键表核心差异》了解基础概念。
yumgpkpm4 天前
人工智能·hadoop·华为·zookeeper·spark·kafka
在AI语言大模型时代 Cloudera CDP(华为CMP 鲲鹏版)对自有知识的保护在AI语言大模型时代 Cloudera CDP(华为CMP 鲲鹏版)对自有知识的保护博文末尾处有下载方式:
zhangxl-jc4 天前
数据仓库·hive·hadoop
Hive基本操作日记以前自建部署的hive on hdfs数据仓库21年早已下线,本文档为当时简单做的日记,偶然整理文档发现,弃之可惜, 本文章留作未来可能参考使用。