【hive】报错累积

6.1 创建新表

  • 错误1:FAILED: SemanticException [Error 10006]: Line 1:63 Partition not found '"20210919"'

    • 场景:在创建例行表时,报错。
    • 这种情况是先创建了多级分区表(date,product),在落表跑数时只指定了一个分区(date)
    • 解决:修改分区字段,与已有表里保持一致;或者删掉已有表,重新落表
  • 错误2:FAILED: SemanticException [Error 10035]: Column repeated in partitioning columns

    • 场景:在创建例行表时,报错。
    • 这种情况是在创建新表时先指定了某字段,但在指定分区时又重复出现了该字段(date)
    • 解决:在创建表字段时,去掉date或者修改分区字段值

6.2 数据倾斜

  • 利用rand()解决跑数
    • 存在较多未登录用户时,利用rand()函数将未登录打散
sql 复制代码
if(nvl(a.u_id,0)>0, a.u_id, concat('hive', rand())) = b.u_id
相关推荐
docsz16 小时前
据数据基座搭建
大数据·hadoop
RestCloud18 小时前
流式优先数据架构:从批量ETL到事件驱动架构的演进之路
数据仓库·etl·cdc·数据处理·数据集成·数据传输·数据同步
coderlin_18 小时前
LangGraph项目二 同步数据仓库信息到元数据库并且建立向量索引
数据库·数据仓库
隐于花海,等待花开1 天前
COLLECT_LIST函数详解
hive
隐于花海,等待花开1 天前
数据开发常问的技术性问题及解答
大数据·hive
曹宇飞丶1 天前
ambari server及元数据库(postgreSQL)迁移
hadoop·ambari
隐于花海,等待花开2 天前
窗口函数之排序函数详细解读及示例
大数据·数据库·hive
数字化顾问2 天前
(87页PPT)数据战略规划(附下载方式)
大数据·数据仓库·数据挖掘
隐于花海,等待花开2 天前
Hive 正则函数详解与示例
数据仓库·hive·hadoop
隐于花海,等待花开2 天前
Hive专题:数据开发面试高频题(TopN、留存、连续登录等)
hive·hadoop·面试