hive表字段跟字段对应的值转为json数组

第一种方式 直接用hive 函数实现

复制代码
select collect_list(named_struct('id',id,'name',name)) from table  

此方式不适用于字段数量过多的情况(比较麻烦)

第二种方式 写udf 函数

复制代码
import org.apache.hadoop.hive.ql.exec.Description;
import org.apache.hadoop.hive.ql.exec.UDF;
import org.apache.hadoop.hive.ql.metadata.Table;
import org.apache.hadoop.hive.ql.metadata.TableNotFoundException;
import org.json.JSONArray;
import org.json.JSONObject;

@Description(
    name = "table_to_json_array",
    value = "Converts data from a Hive table to a JSON array.",
    extended = "Example:\n" +
            "  SELECT table_to_json_array('your_table') AS json_array FROM your_table;"
)
public class TableToJsonArray extends UDF {

    public String evaluate(String tableName) {
        try {
            // 获取 Hive 表对象
            Table table = getTable(tableName);

            // 获取表的结构(字段名)
            String[] fieldNames = table.getAllCols().stream().map(column -> column.getName()).toArray(String[]::new);

            // 构建查询
            StringBuilder queryBuilder = new StringBuilder();
            queryBuilder.append("SELECT ");

            for (int i = 0; i < fieldNames.length; i++) {
                queryBuilder.append("named_struct('")
                            .append(fieldNames[i])
                            .append("', ")
                            .append(fieldNames[i])
                            .append(")");

                if (i < fieldNames.length - 1) {
                    queryBuilder.append(", ");
                }
            }

            queryBuilder.append(" FROM ")
                        .append(tableName);

            // 执行查询
            String query = queryBuilder.toString();
            JSONArray jsonArray = executeQuery(query);

            // 返回 JSON 数组
            return jsonArray.toString();
        } catch (TableNotFoundException e) {
            // 处理表不存在的情况
            return null;
        }
    }

    // 获取 Hive 表对象
    private Table getTable(String tableName) throws TableNotFoundException {
        // 使用 Hive 元数据获取表对象
        // 这里需要适应你的环境和需求来获取表对象
        // 示例代码省略了实际获取表对象的细节
        throw new TableNotFoundException("Table not found: " + tableName);
    }

    // 执行查询并返回结果
    private JSONArray executeQuery(String query) {
        // 在这里执行查询并返回结果的代码,可以使用 Hive 的 JDBC 驱动程序或其他适当的方式执行查询
        // 返回的结果应该是一个 JSON 数组
        // 示例代码省略了实际查询和结果处理的细节
        return new JSONArray(); // 返回空数组作为示例
    }
}

此方式不适用于获取表种某几个字段及字段对应的值的情况

相关推荐
NiceCloud喜云2 小时前
Claude Code 跑 HyperFrames 实测:本地生成 AI 视频素材全流程
java·运维·人工智能·自动化·json·音视频·飞书
段一凡-华北理工大学3 小时前
工业领域的Hadoop架构学习~系列文章02:HDFS架构深度剖析
大数据·人工智能·hadoop·学习·架构·高炉炼铁
逍遥德3 小时前
PostgreSQL --- JSON 函数详解
数据库·sql·postgresql·json
Irene19914 小时前
Oracle(字符集分为服务端和客户端) 和 Hive(依赖 MySQL(或 PostgreSQL)存储元数据)字符集编码格式查询,中文乱码处理
hive·sql·oracle
段一凡-华北理工大学4 小时前
工业领域的Hadoop架构学习~系列文章03:MapReduce编程模型深度解读
大数据·人工智能·hadoop·学习·架构·高炉炼铁·高炉智能化
輕華5 小时前
Flask_GET请求与JSON响应实战详解
python·flask·json
无关86885 小时前
StarRocks 存算分离 + Spark + Hive Metastore + MinIO 数据湖搭建全流程
大数据·hive·spark
NiceCloud喜云16 小时前
Claude Code Routines 实战:三种触发器跑通云端自动化编码
android·运维·数据库·人工智能·自动化·json·飞书
海兰17 小时前
Kibana Dashboard as Code:Elastic 9.4 如何用 Terraform 和类型化 API 终结“JSON 垃圾袋“
云原生·json·terraform
前网易架构师-高司机1 天前
带标注的交警识别数据集,可识别交警和非交警,5587张图,支持yolo,coco json,voc xml,文末有模型训练代码
xml·yolo·json·数据集·交警