HIVE SQL中替换不可见字符的正则表达式

一.替换字符串中的空白字符

对于剔除字符串首尾的空格,使用较多的是trim()ltrim()rtrim()函数,但是他们无法去除字符串中间的空格。

这个时候通常会使用正则表达式来替换字符串中的空白字符\s表示匹配任何空白字符,包括空格、制表符、换页符等等, 等价于[ \f\n\r\t\v]。

c 复制代码
select regexp_replace('  abcd  ef  g ','\\s+','');

返回结果:

'abcdefg'

二.替换字符串中的无法解析的非法字符

在实际清洗过程中,发现即使使用了'\\s+'正则进行替换后,仍旧出现字符串中存在不可见字符的情况。这往往是因为上有数据在解析过程中未将无法解析的非法字符剔除掉。

这个时候可以使用regexp_replace(col_name,'[\\x00-\\x08\\x0B-\\x0C\\x0E-\\x1F]+|\\s+','')进一步对不可见字符进行处理。

相关推荐
w***37512 小时前
【SQL技术】不同数据库引擎 SQL 优化方案剖析
数据库·sql
--fancy3 小时前
如何使用Tushare构建自己的本地量化投研数据库
数据库·sql·数据分析
我科绝伦(Huanhuan Zhou)5 小时前
SQL进阶必备:从计算字段到多表联结,让查询效率翻倍!
数据库·sql
l1t10 小时前
利用DuckDB列表一句SQL输出乘法口诀表
数据库·sql·算法·duckdb
q***996310 小时前
SQL 中 COUNT 的用法详解
数据库·sql
wind_one110 小时前
9.基础--SQL--DML-插入
数据库·sql
float_六七10 小时前
SQL中=与IS的区别:关键用法解析
java·数据库·sql
oh-pinpin10 小时前
【BurpSuite】【SQLmap】sql注入漏洞
sql·web安全·安全性测试
l***749410 小时前
Spring Boot 中使用 @Transactional 注解配置事务管理
数据库·spring boot·sql
l1t19 小时前
调用python函数的不同方法效率对比测试
开发语言·数据库·python·sql·duckdb