HiveSQL:提取json串内容——get_json_oject和json_tuple

提取json串中内容,json格式示例如下

方法(运行环境Hive)

get_json_object

sql 复制代码
select  json_data
  ,get_json_object(json_data,'$.price')  as price -- 取第一层
  ,get_json_object(json_data,'$.inquiry_params')  as inquiry_params -- 取第一层,取本身也是个json串
  ,get_json_object(json_data,'$.params.cateId') as cateId -- 取多层嵌套的
  ,get_json_object(json_data,'$.inquiry_params.颜色') as color2 -- 中文名的 ,此方法失败
from ods.ods_table1 a
where get_day='2024-08-10' 

可以看到,当json中对应的key是中文时,使用get_json_object获取失败,改为使用json_tuple。

json_tuple

首先,先看下如果获取前3个内容,json_tuple和get_json_object的不同。

sql 复制代码
select  json_data
  ,get_json_object(json_data,'$.aprice')  as price
  ,get_json_object(json_data,'$.inquiry_params')  as inquiry_params
  ,get_json_object(json_data,'$.params.cateId') as cateId
  ,t1.text1
  ,t1.text2
  ,t1.text3
from ods.ods_table1 a
lateral view json_tuple(json_data,'price','inquiry_params','cateId') t1 as text1,text2,text3 
where get_day='2024-08-10' 

从上述例子,发现json_tuple和get_json_object的一些不同

  1. 可以看到json_tuple一次可以取多个内容;
  2. json_tuple只能取到 ,取不到嵌套的里层的内容,表现为cateId为NULL(text3列)。

那么回过头来,看看我们要取"颜色"的问题:

因为要取的颜色是在嵌套在json_data的inquiry_parms里的,不是第一层,json_tuple不能直接取到,那么做个改动:把传入函数的json_data改为inquiry_parms ,那么"颜色"就变成第一层了,这样使用json_tuple就可以取到了。

json_tuple只能取到 。

sql 复制代码
select  brand,product_name,title,json_data
  ,get_json_object(json_data,'$.price')  as price
  ,get_json_object(json_data,'$.inquiry_params')  as inquiry_params
  ,get_json_object(json_data,'$.params.cateId') as cateId
  ,get_json_object(json_data,'$.inquiry_params.颜色') as color2
  -- 取中文key的内容
  ,t1.color5
  ,t1.function5
  ,t1.rag5
from ods.ods_table1 a
lateral view json_tuple(get_json_object(json_data,'$.inquiry_params'),'颜色','功能性问题(可多选或不选)','容量') t1 as color5,function5,rag5 -- 近期的会标记99新,好像不是所有的都能区分国行;
-- 把get_json_object(json_data,'$.inquiry_params')作为整体传入json_tuple函数
where get_day='2024-08-10' 

*[第一层]: 这里说的“第一层”,是指从外往里数

相关推荐
白鲸开源1 小时前
收藏!史上最全 Apache SeaTunnel Source 连接器盘点 (2025版),一篇通晓数据集成生态
大数据·数据库·开源
MonKingWD1 小时前
MySQL事务篇-事务概念、并发事务问题、隔离级别
数据库·后端·mysql
Java水解1 小时前
深入理解 SQL 中的 COALESCE、NULLIF 和 IFNULL 函数
后端·sql
我科绝伦(Huanhuan Zhou)2 小时前
银河麒麟V10一键安装Oracle 11g脚本分享
数据库·oracle
秋千码途3 小时前
一道同分排名的SQL题
数据库·sql
秋难降5 小时前
零基础学SQL(八)——事务
数据库·sql·mysql
Starry_hello world5 小时前
MySql 表的约束
数据库·笔记·mysql·有问必答
RestCloud6 小时前
ETLCloud中的数据转化规则是什么意思?怎么执行
数据库·数据仓库·etl
一个天蝎座 白勺 程序猿6 小时前
Apache IoTDB(4):深度解析时序数据库 IoTDB 在Kubernetes 集群中的部署与实践指南
数据库·深度学习·kubernetes·apache·时序数据库·iotdb
.Shu.6 小时前
Redis zset 渐进式rehash 实现原理、触发条件、执行流程以及数据一致性保障机制【分步源码解析】
数据库·redis·缓存