【hive】报错累积

6.1 创建新表

  • 错误1:FAILED: SemanticException [Error 10006]: Line 1:63 Partition not found '"20210919"'

    • 场景:在创建例行表时,报错。
    • 这种情况是先创建了多级分区表(date,product),在落表跑数时只指定了一个分区(date)
    • 解决:修改分区字段,与已有表里保持一致;或者删掉已有表,重新落表
  • 错误2:FAILED: SemanticException [Error 10035]: Column repeated in partitioning columns

    • 场景:在创建例行表时,报错。
    • 这种情况是在创建新表时先指定了某字段,但在指定分区时又重复出现了该字段(date)
    • 解决:在创建表字段时,去掉date或者修改分区字段值

6.2 数据倾斜

  • 利用rand()解决跑数
    • 存在较多未登录用户时,利用rand()函数将未登录打散
sql 复制代码
if(nvl(a.u_id,0)>0, a.u_id, concat('hive', rand())) = b.u_id
相关推荐
是阿威啊9 小时前
【第二站】本地hadoop集群配置yarn模式
大数据·linux·hadoop·yarn
好大哥呀14 小时前
Hadoop yarn
大数据·hadoop·分布式
红队it15 小时前
【数据分析】基于Spark链家网租房数据分析可视化大屏(完整系统源码+数据库+开发笔记+详细部署教程+虚拟机分布式启动教程)✅
java·数据库·hadoop·分布式·python·数据分析·spark
本旺2 天前
【数据开发离谱场景记录】Hive + ES 复杂查询场景处理
hive·hadoop·elasticsearch
莫叫石榴姐2 天前
Doris为2.1版本,但json_each不可以用解决方法
数据仓库·json
无泪无花月隐星沉2 天前
uos server 1070e部署Hadoop
大数据·运维·服务器·hadoop·分布式·uos·国产化os
悟能不能悟2 天前
springboot全局异常
大数据·hive·spring boot
是阿威啊2 天前
【第一站】本地虚拟机部署Hadoop分布式集群
大数据·linux·hadoop·分布式
lightningyang2 天前
Hadoop 分布式集群配置(OpenEuler 1主2)
hadoop·openeuler·天枢一体化虚拟仿真靶场平台
是阿威啊2 天前
【第六站】测试本地项目连接虚拟机上的大数据集群
大数据·linux·hive·hadoop·spark·yarn