从Hive函数collect到MySQL函数group_concat

问题背景:

在工作中遇到数据分析时对结果展示的要求。需求如下: 查询在关注时间窗口下(7日)公司相同账户与不同交易对手账户之间的交易行为。 原本预计的展示结果为:

公司账户 公司信息 交易对手账户 交易对手信息 交易信息(日期等)
66666666 AAA 99999991 BBB1 2025-11-04
66666666 AAA 99999992 BBB2 2025-11-06
66666666 AAA 99999993 BBB3 2025-11-15
66666666 AAA 99999994 BBB4 2025-11-22
88888888 AAA 99999995 BBB5 2025-11-26
88888888 AAA 99999996 BBB6 2025-12-01
88888888 AAA 99999997 BBB7 2025-12-30
88888888 AAA 99999998 BBB8 2026-01-01
88888888 AAA 99999999 BBB9 2026-01-04

由于重复数据太多不便于业务人员查看数据之间的关系,经与业务人员讨论后决定调整为如下展示方式:

公司账户 公司信息 相关数据
66666666 AAA 交易对手账户:99999991 交易对手信息:BBB1 交易信息(日期等):2025-11-04 交易对手账户:99999992 交易对手信息:BBB2 交易信息(日期等):2025-11-06
66666666 AAA 交易对手账户:99999993 交易对手信息:BBB3 交易信息(日期等):2025-11-15 交易对手账户:99999994 交易对手信息:BBB4 交易信息(日期等):2025-11-22
88888888 AAA 交易对手账户:99999995 交易对手信息:BBB5 交易信息(日期等):2025-11-26 交易对手账户:99999996 交易对手信息:BBB6 交易信息(日期等):2025-12-01
88888888 AAA 交易对手账户:99999997 交易对手信息:BBB7 交易信息(日期等):2025-12-30 交易对手账户:99999998 交易对手信息:BBB8 交易信息(日期等):2026-01-01 交易对手账户:99999999 交易对手信息:BBB9 交易信息(日期等):2026-01-04

解决方法:

这样的展示方式就需要一个合适的聚合函数来进行数据内容汇总。 之前常使用Hive开发这种情况多用collect,但是本次使用的MySQL使用的时候发现没有这个函数。后面决定使用group_concat。 group_concat嵌套concat_ws可以很好的达到上面的效果:

sql 复制代码
    ,group_concat(concat_ws(''  
         ' 交易对手账户:',account  
        ,' 交易对手信息:',account_info  
        ,' 交易信息(日期等):',trade_date  
  ) ORDER BY trade_date SEPARATOR ';\n') as 相关数据

但是使用起来发现如果数据太长会有数据截断的问题。因此如果数据量比较大需要注意以下设置:

sql 复制代码
-- 查看和设置 GROUP_CONCAT 相关参数
SHOW VARIABLES LIKE 'group_concat_max_len';

-- 临时设置最大长度(默认1024字节) 会话级配置
SET SESSION group_concat_max_len = 1000000;

-- 在查询中设置
SET @@group_concat_max_len = 1000000;

以上就是对于数据汇总展示的一个总结。希望能帮助到需要展示思路 与需要聚合思路的朋友。

番外:

后面了解到也可以通过json的方式来展示这部分数据:

sql 复制代码
JSON_ARRAYAGG(  
    JSON_OBJECT(  
         '交易对手账户',account  
        ,'交易对手信息',account_info  
        ,'交易信息(日期等)',trade_date 
    )  
) as 相关数据

不过问题是展示的字段顺序不可控。这个问题还没有解决的好办法,如果有大佬看到请多做指点。

相关推荐
萧曵 丶1 小时前
Next-Key Lock、记录锁、间隙锁浅谈
数据库·sql·mysql·mvcc·可重复读·幻读
莳花微语2 小时前
记录一次OGG进程abended,报错OGG-01431、OGG-01003、OGG-01151、OGG-01296问题的处理
数据库·sql·mysql
萧曵 丶2 小时前
MySQL三大日志系统浅谈
数据库·sql·mysql
麦聪聊数据4 小时前
MySQL 性能调优:从EXPLAIN到JSON索引优化
数据库·sql·mysql·安全·json
lalala_lulu5 小时前
MySQL中InnoDB支持的四种事务隔离级别名称,以及逐级之间的区别?(超详细版)
数据库·mysql
CV工程师的自我修养5 小时前
你的SQL为什么慢?看懂MySQL EXPLAIN执行计划,快速定位性能瓶颈
数据库·mysql
y_想不到名字6 小时前
MySQL windows版本免安装
数据库·mysql
萧曵 丶6 小时前
MySQL 事务隔离级别及实际业务问题详解
数据库·mysql
南知意-6 小时前
Navicat 17 下载安装教程!
数据库·mysql·navicat·数据库连接
技术净胜7 小时前
MySQL 8.0 超详细保姆级官方版下载安装完整教程步骤(含环境配置+安装包下载)
数据库·mysql·adb