Hive删除符合条件的记录

Hive在使用中不支持updatedelete操作,那么如果想删除部分条件的记录需要怎么操作?本文记录下解决方法。

思路:使用select+where选出想要保留的数据,使用insert overwrite向原表覆盖插入数据.

sql 复制代码
insert overwrite table dbname.tableName
select * from dbname.tableName 
where <condition>

-- 实例:Hive表删除'2023-11-23'更新的数据
insert overwrite table dbname.tableName
select * from dbname.tableName 
where up_date<>'2023-11-23'

-- 分区表下操作
insert overwrite table dbname.tableName partition (pmf='2023-11')
select * from dbname.tableName 
where pmf='2023-11'
and up_date<>'2023-11-23'
相关推荐
cxr82824 分钟前
基于Claude Code的 规范驱动开发(SDD)指南
人工智能·hive·驱动开发·敏捷流程·智能体
Lx35210 小时前
Hadoop数据处理模式:批处理与流处理结合技巧
大数据·hadoop
皆过客,揽星河10 小时前
Linux上安装MySQL8详细教程
android·linux·hadoop·mysql·linux安装mysql·数据库安装·详细教程
core51213 小时前
Hive实战(二)
数据仓库·hive·hadoop
奋斗的蛋黄15 小时前
大数据与云计算知识点
大数据·hadoop·云计算
计算机编程-吉哥1 天前
大数据毕业设计-基于Python的中文起点网小说数据分析平台(高分计算机毕业设计选题·定制开发·真正大数据)
大数据·hadoop·计算机毕业设计选题·机器学习毕业设计·大数据毕业设计·大数据毕业设计选题推荐·大数据毕设项目
Agatha方艺璇1 天前
Hive基础简介
数据仓库·hive·hadoop
IT研究室1 天前
大数据毕业设计选题推荐-基于大数据的国内旅游景点游客数据分析系统-Spark-Hadoop-Bigdata
大数据·hadoop·spark·毕业设计·源码·数据可视化·bigdata
Lx3521 天前
YARN资源调度优化:最大化集群利用率
大数据·hadoop
Leo.yuan1 天前
不同数据仓库模型有什么不同?企业如何选择适合的数据仓库模型?
大数据·数据库·数据仓库·信息可视化·spark