HIVE SQL中替换不可见字符的正则表达式

一.替换字符串中的空白字符

对于剔除字符串首尾的空格,使用较多的是trim()ltrim()rtrim()函数,但是他们无法去除字符串中间的空格。

这个时候通常会使用正则表达式来替换字符串中的空白字符\s表示匹配任何空白字符,包括空格、制表符、换页符等等, 等价于[ \f\n\r\t\v]。

c 复制代码
select regexp_replace('  abcd  ef  g ','\\s+','');

返回结果:

'abcdefg'

二.替换字符串中的无法解析的非法字符

在实际清洗过程中,发现即使使用了'\\s+'正则进行替换后,仍旧出现字符串中存在不可见字符的情况。这往往是因为上有数据在解析过程中未将无法解析的非法字符剔除掉。

这个时候可以使用regexp_replace(col_name,'[\\x00-\\x08\\x0B-\\x0C\\x0E-\\x1F]+|\\s+','')进一步对不可见字符进行处理。

相关推荐
乐123915 小时前
追飞机 icao数据库地址
sql
YxVoyager15 小时前
Qt C++ :QRegularExpression 正则表达式使用详解
c++·qt·正则表达式
Hello.Reader15 小时前
PyFlink DataStream 程序骨架、常用 Source/Sink、状态(State)、与 Table/SQL 互转一篇搞定
数据库·sql·linq
俊哥大数据16 小时前
【项目6】基于Hadoop+Hive+Springboot+vue新闻资讯大数据仓库项目
数据仓库·hive·hadoop
laocooon5238578861 天前
正则表达式的全面介绍
正则表达式
kejiayuan1 天前
CTE更易懂的SQL风格
数据库·sql
PyHaVolask1 天前
SQL注入漏洞原理
数据库·sql
2501_933513041 天前
Oracle统计分析某个SQL的执行频率
数据库·sql·oracle
l1t1 天前
DeepSeek辅助编写的利用位掩码填充唯一候选数方法求解数独SQL
数据库·sql·算法·postgresql
冰暮流星1 天前
sql语句之select语句的基本使用
数据库·sql·mysql