技术栈
数据仓库
十月南城
1 天前
大数据
·
数据库
·
数据仓库
·
hive
·
hadoop
·
spark
数据湖技术对比——Iceberg、Hudi、Delta的表格格式与维护策略
写在前面,本人目前处于求职中,如有合适内推岗位,请加:lpshiyue 感谢。数据湖表格式不是简单的存储规范,而是元数据管理、事务控制与性能优化的综合体现,决定了数据平台的开放性与成熟度
王九思
1 天前
数据仓库
·
hive
·
hadoop
Hive Thrift Server 介绍
Hive Thrift Server 是 Apache Hive 提供的一个基于 Thrift 协议的服务端组件(HiveServer2),允许客户端通过 Thrift API 远程访问 Hive 的数据和元数据。它支持多种编程语言(如 Java、Python、C++等),便于外部应用与 Hive 交互,常用于数据查询、ETL 操作等场景。
土拨鼠烧电路
1 天前
数据仓库
·
笔记
笔记11:数据中台:不是数据仓库,是业务能力复用的引擎
许多公司投入巨资建了数据中台,但业务部门的感觉是:除了多了一个炫酷的数据大屏,日常报表该等还是等,业务问题该难还是难。销售总监依然抱怨“看不到真实的渠道库存”,市场经理依然在“盲投”广告,供应链的计划员依然在凭“经验”猜下个月该生产多少。
Asher0509
1 天前
数据仓库
·
hive
·
hadoop
Hive核心知识:从基础到实战全解析
Hive是基于Hadoop的数据仓库工具,本质是将SQL转化为MapReduce(或Tez、Spark)任务来执行,核心用于处理大规模结构化/半结构化数据的存储与分析,不适合实时计算(延迟较高)。
weixin_44931084
3 天前
java
·
数据仓库
·
etl
使用轻易云平台实现数据ETL转换与写入金蝶云星辰V2
在本次系统对接中,我们将重点分享汤臣倍健营销云数据如何高效、可靠地集成到金蝶云星辰V2平台。通过这个案例,您将了解从获取营销云数据,到写入金蝶云星辰V2的全过程及其中涉及的技术细节。
一号IT男
4 天前
数据仓库
·
hive
·
hadoop
Hive中GROUPING SETS功能详解
我们来详细讲解一下 Hive 中的 GROUPING SETS 功能。这是一个非常强大且实用的特性,用于实现高级的多维数据分析。
500佰
4 天前
大数据
·
linux
·
数据仓库
·
hive
·
hadoop
·
云计算
·
运维开发
Hive常见故障多案例FAQ宝典 --项目总结(宝典一)
🥇个人主页:500佰#Hive常见故障 #大数据 #生产环境真实案例 #Hive #离线数据库 #整理 #经验总结
makabalala
7 天前
数据仓库
如何利用YashanDB进行数据仓库构建
随着企业数据量的快速增长,构建高效、可靠的数据仓库成为数据驱动决策的关键步骤。数据库系统在性能瓶颈、数据一致性和扩展性方面面临诸多挑战。YashanDB作为面向在线事务处理和分析型应用的高性能数据库,通过其多样化的部署架构及先进的存储和计算模型,为数据仓库构建提供了坚实基础。本文将系统分析YashanDB的体系架构、存储引擎、事务机制及优化器等关键技术,助力工程师构建高效可用的数据仓库系统。
禅与计算机程序设计艺术
7 天前
数据库
·
数据仓库
·
nosql
·
etl
了解NoSQL的数据仓库和ETL
在本文中,我们将深入了解NoSQL数据仓库和ETL的核心概念、算法原理、最佳实践、应用场景和工具推荐。通过这篇文章,我们希望读者能够更好地理解NoSQL数据仓库和ETL的工作原理,并能够在实际项目中应用这些知识。
派可数据BI可视化
8 天前
大数据
·
数据仓库
·
信息可视化
·
spark
·
商业智能bi
一文读懂系列:数据仓库为什么分层,分几层?数仓建模方法有哪些
简单来说,数仓分层就像盖楼房,不分层就是盖平房,虽然简单快捷,但无法建成复杂、稳固的高楼大厦数据仓库之父 Bill Inmon对数据仓库做了定义——面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。从定义上来看,数据仓库的关键词为面向主题、集成、稳定、反映历史变化、支持管理决策,而这些关键词的实现就体现在分层架构内。
Light60
8 天前
大数据
·
数据仓库
·
数据湖
·
ipaas
·
湖仓一体
·
数据中台
·
领码 spark
不止于名:领码 SPARK 如何“链”动数据仓库、数据湖、中台与湖仓一体新纪元
本文旨在深度剖析商业融合平台“领码 SPARK”与现代企业数据领域五大核心架构——数据仓库、大数据平台、数据湖、数据中台、湖仓一体之间的深层关系。报告首先厘清了“领码 SPARK”与开源计算引擎 Apache Spark 的本质区别,明确其作为“iPaaS+aPaaS”双引擎融合平台的定位。随后,文章系统梳理了五大架构的演进脉络与核心价值,并在此基础上,通过详尽的场景分析和架构解构,论证了领码 SPARK 如何作为“数据动脉”、“智能管家”、“服务化引擎”和“AI 加速器”,无缝集成并赋能这五种架构。本文
郑小憨
8 天前
大数据
·
数据仓库
·
sql
·
flink
·
database
FlinkSQL窗口函数TUMBLE、SESSION 和 HOP的区别
目录TUMBLE 滚动窗口(Tumbling Window)SESSION 会话窗口(Session Window)
码字的字节
8 天前
大数据
·
数据仓库
·
spark
锚点模型:数据仓库中的高度可扩展建模技术详解
数据仓库的发展历程可以追溯到上世纪90年代,当时企业开始意识到需要专门的系统来支持决策分析。早期的数据仓库主要采用维度建模方法,其中最具代表性的是星型模型和雪花模型。
Agentic AI人工智能与大数据
8 天前
大数据
·
数据仓库
·
ai
·
etl
大数据领域数据仓库的ETL任务优化
凌晨三点的告警声"数据报表延迟!销售部门无法获取昨日营收数据!"凌晨三点,某电商平台的数据工程师李明被刺耳的手机告警声惊醒。这已经是本月第三次出现ETL任务延迟问题。随着平台用户量突破1亿,每日数据增量达到50TB,原有的ETL流程如同一条在数据洪流中艰难前行的慢船,频频触礁。
AI架构全栈开发实战笔记
8 天前
数据仓库
·
人工智能
·
ai
·
自动化
AI应用架构师教你:如何用AI自动化数据仓库的测试?
作为一名深耕AI与数据领域15年的架构师,我见过太多数据仓库团队的「测试噩梦」:传统数据仓库测试的核心矛盾,在于**「数据规模的爆炸式增长」与「测试效率的线性提升」之间的不匹配**。而AI,正是解决这一矛盾的「钥匙」——它能把测试从「人力驱动」转向「智能驱动」,让测试工程师从「重复劳动」中解放出来,专注于更复杂的业务逻辑验证。
AI软件工程实践
8 天前
大数据
·
数据仓库
·
ai
解读大数据领域数据仓库的事实表设计
关键词:数据仓库, 事实表设计, 维度建模, 事务事实表, 周期快照事实表, 累积快照事实表, 星型模型
Timer_Cooker
10 天前
数据仓库
·
hive
·
hadoop
Hive Sum(null)编译报错分析
业务需求需要使用hive统计积分point字段,不假思索写上了sum(point)的字段映射,造数null,空格串,空串,数字字符串,含有字母的数字串,结果符合预期。如图:
沃达德软件
11 天前
大数据
·
数据仓库
·
人工智能
·
深度学习
·
机器学习
·
数据库开发
电信诈骗预警平台功能解析
智慧反诈综合预警平台是打击治理电信网络新型违法犯罪作战平台,集资源整合、情报研判、侦查指挥为一体,在打击、防范、治理电信网络诈骗等新型违法犯罪中发挥着重要作用。综合预警平台,包括电话类诈骗预警、网络类诈骗预警、APP 诈骗预警、预警劝阻工作台、预警统计、预警设置。 #智慧警务#数据建模#大数据#大数据分析#大数据平台