HIVE SQL中替换不可见字符的正则表达式

一.替换字符串中的空白字符

对于剔除字符串首尾的空格,使用较多的是trim()ltrim()rtrim()函数,但是他们无法去除字符串中间的空格。

这个时候通常会使用正则表达式来替换字符串中的空白字符\s表示匹配任何空白字符,包括空格、制表符、换页符等等, 等价于[ \f\n\r\t\v]。

c 复制代码
select regexp_replace('  abcd  ef  g ','\\s+','');

返回结果:

'abcdefg'

二.替换字符串中的无法解析的非法字符

在实际清洗过程中,发现即使使用了'\\s+'正则进行替换后,仍旧出现字符串中存在不可见字符的情况。这往往是因为上有数据在解析过程中未将无法解析的非法字符剔除掉。

这个时候可以使用regexp_replace(col_name,'[\\x00-\\x08\\x0B-\\x0C\\x0E-\\x1F]+|\\s+','')进一步对不可见字符进行处理。

相关推荐
木木子99992 小时前
SQL138 连续两次作答试卷的最大时间窗
sql·题解记录
抛砖者3 小时前
hive/spark sql中unix_timestamp 函数的坑以及时间戳相关的转换
hive·sql·spark
野犬寒鸦9 小时前
MyBatis-Plus 中使用 Wrapper 自定义 SQL
java·数据库·后端·sql·mybatis
~ 小团子11 小时前
每日一SQL 【游戏玩法分析 IV】
数据库·sql·游戏
数字芯片实验室16 小时前
分享一个可以学习正则表达式的网址:Pythex.org
学习·正则表达式
尽兴-1 天前
如何将多个.sql文件合并成一个:Windows和Linux/Mac详细指南
linux·数据库·windows·sql·macos
IvanCodes1 天前
Oracle 视图
大数据·数据库·sql·oracle
阿蒙Amon2 天前
C#正则表达式全面详解:从基础到高级应用
开发语言·正则表达式·c#
渣渣盟2 天前
掌握MySQL函数:高效数据处理指南
sql·mysql·adb·dba
??? Meggie2 天前
【SQL】使用UPDATE修改表字段的时候,遇到1054 或者1064的问题怎么办?
android·数据库·sql