【hive】报错累积

6.1 创建新表

  • 错误1:FAILED: SemanticException [Error 10006]: Line 1:63 Partition not found '"20210919"'

    • 场景:在创建例行表时,报错。
    • 这种情况是先创建了多级分区表(date,product),在落表跑数时只指定了一个分区(date)
    • 解决:修改分区字段,与已有表里保持一致;或者删掉已有表,重新落表
  • 错误2:FAILED: SemanticException [Error 10035]: Column repeated in partitioning columns

    • 场景:在创建例行表时,报错。
    • 这种情况是在创建新表时先指定了某字段,但在指定分区时又重复出现了该字段(date)
    • 解决:在创建表字段时,去掉date或者修改分区字段值

6.2 数据倾斜

  • 利用rand()解决跑数
    • 存在较多未登录用户时,利用rand()函数将未登录打散
sql 复制代码
if(nvl(a.u_id,0)>0, a.u_id, concat('hive', rand())) = b.u_id
相关推荐
RestCloud12 小时前
ETL与数据湖Hudi的集成与操作
数据仓库·etl·hudi·数据同步·数据集成平台
苛子12 小时前
实时数据同步工具横评:ETLCloud vs 帆软FDL,谁更适合企业数据平台?
数据仓库·etl
德昂信息dataondemand12 小时前
ETL:解锁数据价值的 “黄金转换器
数据仓库·etl
ApacheSeaTunnel14 小时前
(三)ODS/明细层落地设计要点:把数据接入层打造成“稳定可运维”的基础设施
数据库·数据仓库·数据湖·白鲸开源
网络工程小王15 小时前
【大数据技术详解】——HDFS技术(学习笔记)
hadoop·hdfs·big data
SelectDB技术团队19 小时前
易车 × Apache Doris:构建湖仓一体新架构,加速 AI 业务融合实践
数据仓库·人工智能·数据分析·agent·apache doris·mcp·易车
王的宝库21 小时前
MapReduce / Hive / Pig :从底层批处理到 SQL/脚本落地
hive·hadoop·sql·mapreduce
升职佳兴1 天前
告别 nohup:Hive Metastore 交给 systemd 托管的完整步骤
数据仓库·hive·hadoop
IT从业者张某某1 天前
Docker部署Hadoop-01-Docker安装
hadoop·docker·eureka
小哥哥咯1 天前
数据仓库维度建模思维导图—— 基于《The Data Warehouse Toolkit, 3rd Edition》(第三版修订版)
大数据·数据仓库