【hive】报错累积

6.1 创建新表

  • 错误1:FAILED: SemanticException [Error 10006]: Line 1:63 Partition not found '"20210919"'

    • 场景:在创建例行表时,报错。
    • 这种情况是先创建了多级分区表(date,product),在落表跑数时只指定了一个分区(date)
    • 解决:修改分区字段,与已有表里保持一致;或者删掉已有表,重新落表
  • 错误2:FAILED: SemanticException [Error 10035]: Column repeated in partitioning columns

    • 场景:在创建例行表时,报错。
    • 这种情况是在创建新表时先指定了某字段,但在指定分区时又重复出现了该字段(date)
    • 解决:在创建表字段时,去掉date或者修改分区字段值

6.2 数据倾斜

  • 利用rand()解决跑数
    • 存在较多未登录用户时,利用rand()函数将未登录打散
sql 复制代码
if(nvl(a.u_id,0)>0, a.u_id, concat('hive', rand())) = b.u_id
相关推荐
RestCloud4 小时前
从架构师视角看ETL工具选型:如何构建可演进的数据集成平台
数据仓库·etl·cdc·数据处理·数据传输·elt
卷毛迷你猪13 小时前
快速实验篇(A3)基于 Hive 的气象数据数仓构建与干旱指标初步分析
大数据·hadoop·分布式
卷毛迷你猪13 小时前
快速实验篇(A4)Hive 数据仓库进阶:全站点干旱事件识别与多维统计分析
数据仓库·hive·hadoop·分布式
冰上浮云15 小时前
Gravitino iceberg catalog backend 为hive 获取元数据过程
数据仓库·hive·hadoop·gravitino
段一凡-华北理工大学15 小时前
工业领域的Hadoop架构学习~系列文章06:Hive数据仓库
数据仓库·hadoop·架构·高炉炼铁·工业智能体·高炉智能化·hive数据仓库
zgl_200537791 天前
源代码:跨数据库通用SQL语法解析与标注拆解
大数据·数据库·数据仓库·sql·etl·源代码管理
暴躁小师兄数据学院1 天前
【AI大数据工程师特训笔记】第13讲:数据库性能手术刀
大数据·数据库·数据仓库·sql·postgresql
段一凡-华北理工大学2 天前
工业领域的Hadoop架构学习~系列文章04:YARN资源调度架构
人工智能·hadoop·学习·架构·系统架构·高炉炼铁·高炉炼铁智能化
卷毛迷你猪2 天前
快速实验篇(A2-2)数据清洗规则修正与多语言实现验证
hadoop·分布式
段一凡-华北理工大学2 天前
工业领域的Hadoop架构学习~系列文章05:Kafka消息队列 - 工业数据流传输
人工智能·hadoop·学习·架构·kafka·工业智能体·高炉炼铁智能化