HIVE SQL中替换不可见字符的正则表达式

一.替换字符串中的空白字符

对于剔除字符串首尾的空格,使用较多的是trim()ltrim()rtrim()函数,但是他们无法去除字符串中间的空格。

这个时候通常会使用正则表达式来替换字符串中的空白字符\s表示匹配任何空白字符,包括空格、制表符、换页符等等, 等价于[ \f\n\r\t\v]。

c 复制代码
select regexp_replace('  abcd  ef  g ','\\s+','');

返回结果:

'abcdefg'

二.替换字符串中的无法解析的非法字符

在实际清洗过程中,发现即使使用了'\\s+'正则进行替换后,仍旧出现字符串中存在不可见字符的情况。这往往是因为上有数据在解析过程中未将无法解析的非法字符剔除掉。

这个时候可以使用regexp_replace(col_name,'[\\x00-\\x08\\x0B-\\x0C\\x0E-\\x1F]+|\\s+','')进一步对不可见字符进行处理。

相关推荐
Hello.Reader31 分钟前
Flink × Hive HiveCatalog 一键接入元数据,Flink 直接读写 Hive 表
大数据·hive·flink
么么...1 小时前
系统性 MySQL 优化:性能分析、索引设计与失效场景全解
数据库·经验分享·sql·mysql
YongCheng_Liang1 小时前
分布式数据库核心原理深度解析:架构、理论与事务解决方案
运维·数据库·sql
派大鑫wink1 小时前
【Day47】MyBatis 进阶:动态 SQL、关联查询(一对一 / 一对多)
数据库·sql·mybatis
Hello.Reader1 小时前
Flink + Hive Functions HiveModule、原生聚合加速、复用 Hive UDF/UDTF/UDAF
大数据·hive·flink
周某人姓周2 小时前
sql报错注入常见7个函数
sql·安全·web安全·网络安全
明天…ling2 小时前
sql注入(1-10关)
java·数据库·sql
Dolphin_Home3 小时前
数据库报错:1138 - Invalid use of NULL value 解决方案
数据库·sql·mysql
独自破碎E3 小时前
动态规划-正则表达式匹配
算法·正则表达式·动态规划
Hello.Reader3 小时前
Flink Hive 把 Hive 表变成“可流式消费”的数仓底座
大数据·hive·flink