Hive借助java反射解决User-agent编码乱码问题

一、需求背景

在截取到浏览器user-agent,并想保存入数据库中,经查询发现展示的为编码后的结果。
现需要经过url解码过程,将解码后的结果保存进数据库,那么有几种实现方式。

二、问题解决

1、百度:url在线解码工具

输入下述内容,得到解码后的结果

复制代码
Mozilla/5.0%20(Macintosh;%20Intel%20Mac%20OS%20X%2010_6_8)%20AppleWebKit/537.13+%20(KHTML,%20like%20Gecko)%20Version/5.1.7%20Safari/534.57.2

但不能对每一个ua都在线进行完解码后,再存入数据库,操作量太大了,重复!

2、借助java程序实现

复制代码
通过URLDecoder.decode()方法,将参数填入进去,最后输出解码后的结果来实现。

即可以通过Hive自定义UDF函数的形式,将上述方法进行封装使用。

3、借助Hive的反射实现

先看下反射的详细情况

可以看到,先写类名,再写方法名,参数可有可无

运行结果展示,优于自定义UDF函数,更简便:

相关推荐
跟着珅聪学java9 小时前
Logback日志配置教程
数据仓库·hive·hadoop
yumgpkpm14 小时前
腾讯TBDS和CMP(Cloud Data AI Platform,类Cloudera CDP,如华为鲲鹏 ARM 版)比较的缺陷在哪里?
hive·hadoop·elasticsearch·zookeeper·oracle·kafka·hbase
心止水j16 小时前
hive案例
数据仓库·hive·hadoop
mn_kw17 小时前
Hive 统计信息自动收集机制深度解析
数据仓库·hive·hadoop
mn_kw17 小时前
Hive On Spark 统计信息收集深度解析
hive·hadoop·spark
克喵的水银蛇20 小时前
Flutter 本地存储实战:SharedPreferences+Hive+SQLite
hive·flutter·sqlite
howard20052 天前
6.5 Hive查询优化:执行计划与性能初探
hive·性能优化·执行计划
大数据002 天前
SCD缓慢变化维Type1-Type3
hive·scd
張萠飛3 天前
hive date_format函数有性能瓶颈,有个获取时区的逻辑影响性能,具体原因分析
数据仓库·hive·hadoop
2509_940880223 天前
Spring Boot 从 2.7.x 升级到 3.3注意事项
数据库·hive·spring boot