HiveSQL:提取json串内容——get_json_oject和json_tuple

提取json串中内容,json格式示例如下

方法(运行环境Hive)

get_json_object

sql 复制代码
select  json_data
  ,get_json_object(json_data,'$.price')  as price -- 取第一层
  ,get_json_object(json_data,'$.inquiry_params')  as inquiry_params -- 取第一层,取本身也是个json串
  ,get_json_object(json_data,'$.params.cateId') as cateId -- 取多层嵌套的
  ,get_json_object(json_data,'$.inquiry_params.颜色') as color2 -- 中文名的 ,此方法失败
from ods.ods_table1 a
where get_day='2024-08-10' 

可以看到,当json中对应的key是中文时,使用get_json_object获取失败,改为使用json_tuple。

json_tuple

首先,先看下如果获取前3个内容,json_tuple和get_json_object的不同。

sql 复制代码
select  json_data
  ,get_json_object(json_data,'$.aprice')  as price
  ,get_json_object(json_data,'$.inquiry_params')  as inquiry_params
  ,get_json_object(json_data,'$.params.cateId') as cateId
  ,t1.text1
  ,t1.text2
  ,t1.text3
from ods.ods_table1 a
lateral view json_tuple(json_data,'price','inquiry_params','cateId') t1 as text1,text2,text3 
where get_day='2024-08-10' 

从上述例子,发现json_tuple和get_json_object的一些不同

  1. 可以看到json_tuple一次可以取多个内容;
  2. json_tuple只能取到 ,取不到嵌套的里层的内容,表现为cateId为NULL(text3列)。

那么回过头来,看看我们要取"颜色"的问题:

因为要取的颜色是在嵌套在json_data的inquiry_parms里的,不是第一层,json_tuple不能直接取到,那么做个改动:把传入函数的json_data改为inquiry_parms ,那么"颜色"就变成第一层了,这样使用json_tuple就可以取到了。

json_tuple只能取到 。

sql 复制代码
select  brand,product_name,title,json_data
  ,get_json_object(json_data,'$.price')  as price
  ,get_json_object(json_data,'$.inquiry_params')  as inquiry_params
  ,get_json_object(json_data,'$.params.cateId') as cateId
  ,get_json_object(json_data,'$.inquiry_params.颜色') as color2
  -- 取中文key的内容
  ,t1.color5
  ,t1.function5
  ,t1.rag5
from ods.ods_table1 a
lateral view json_tuple(get_json_object(json_data,'$.inquiry_params'),'颜色','功能性问题(可多选或不选)','容量') t1 as color5,function5,rag5 -- 近期的会标记99新,好像不是所有的都能区分国行;
-- 把get_json_object(json_data,'$.inquiry_params')作为整体传入json_tuple函数
where get_day='2024-08-10' 

*[第一层]: 这里说的“第一层”,是指从外往里数

相关推荐
鱼跃鹰飞15 分钟前
面试题:解释一下什么是全字段排序和rowid排序
数据结构·数据库·mysql
Aloudata技术团队27 分钟前
完美应对千亿级明细数据计算:Aloudata CAN 双引擎架构详解
数据库·数据分析·数据可视化
Dxy123931021628 分钟前
MySQL连表查询讲解:从基础到实战
数据库·mysql
DemonAvenger28 分钟前
Redis数据迁移与扩容实战:平滑扩展的技术方案
数据库·redis·性能优化
毕设十刻37 分钟前
基于Vue的民宿管理系统st4rf(程序 + 源码 + 数据库 + 调试部署 + 开发环境配置),配套论文文档字数达万字以上,文末可获取,系统界面展示置于文末
前端·数据库·vue.js
人工智能知识库43 分钟前
2026年HCCDP-GaussDB工作级开发者题库(详细解析)
数据库·华为·gaussdb·题库·hccdp-gaussdb·工作级开发者认证
爱吃土豆的马铃薯ㅤㅤㅤㅤㅤㅤㅤㅤㅤ1 小时前
sql 如果字段为空就用另一个字段
数据库·sql
一人の梅雨1 小时前
亚马逊SP-API商品评论接口实战:情感分析+商业洞察挖掘的差异化方案
运维·前端·数据库
qq_435139571 小时前
多级缓存(Caffeine+Redis)技术实现文档
数据库·redis·缓存
程序修理员1 小时前
oracle备份表还原
数据库·oracle