hive 动态分区参数设置错误导致数据不稳定

hive 动态分区参数设置错误导致数据不稳定

现象

昨天下班前同事遇到个问题来问我,sap的一个dwr模型数据有时候正常有时候异常,看了调度作业日志都正常,也是在上游dwi跑完以后再执行的。

上游dwi是1点多刷新的数据,dwr是3点多才开始。

为啥他手动跑一下又正常了??

原因

set hive.exec.dynamic.partition = ture;

英语没那么敏感的同学,是没那么容易发现 true 和 ture 的区别,所以当同事知道原因以后的反应是:这么坑爹!

解决思路

把 ture 改成 true 应该就可以了。(后续待更新处理结果)

相关推荐
得物技术3 天前
从埋点需求到规则资产:Hermes Agent 重构得物数仓工作流
大数据·llm·ai编程
久美子3 天前
AI驱动数仓建设的Harness工程实践——本体建模、知识分层与上下文工程
大数据
大树884 天前
金刚石散热越强,管路越先见顶
大数据·运维·服务器·人工智能·ai
大志哥1234 天前
ES和Logstash日志链路系统上线后遭遇切片爆炸(解决)
大数据·elasticsearch
果丁智能4 天前
物联网智能锁赋能集中式住宿:身份核验与远程权限管控的全链路技术实践
大数据·人工智能·物联网·智能家居
王小王-1234 天前
基于 Hive 的网易云音乐数据分析及可视化系统
hive·hadoop·数据分析·音乐数据分析·网易云音乐分析·hive音乐分析·hadoop网易云
ApacheSeaTunnel4 天前
实战演示 | 基于 Apache SeaTunnel 与 Apache DolphinScheduler 实现 MySQL 到 Doris 离线定时增量同步
大数据·mysql·开源·doris·数据集成·seatunnel·数据同步
weixin_397574094 天前
PDF复杂表格的1:1还原引擎:跨页表格自动拼接技术实战
大数据·人工智能·pdf
极光代码工作室4 天前
基于数据仓库的电商数据分析平台
大数据·hadoop·python·spark·数据可视化
秋名山码民4 天前
Graph RAG 深度解析:从向量检索到知识推理的技术演进
大数据·人工智能·rag