HIVE SQL中替换不可见字符的正则表达式

一.替换字符串中的空白字符

对于剔除字符串首尾的空格,使用较多的是trim()ltrim()rtrim()函数,但是他们无法去除字符串中间的空格。

这个时候通常会使用正则表达式来替换字符串中的空白字符\s表示匹配任何空白字符,包括空格、制表符、换页符等等, 等价于[ \f\n\r\t\v]。

c 复制代码
select regexp_replace('  abcd  ef  g ','\\s+','');

返回结果:

'abcdefg'

二.替换字符串中的无法解析的非法字符

在实际清洗过程中,发现即使使用了'\\s+'正则进行替换后,仍旧出现字符串中存在不可见字符的情况。这往往是因为上有数据在解析过程中未将无法解析的非法字符剔除掉。

这个时候可以使用regexp_replace(col_name,'[\\x00-\\x08\\x0B-\\x0C\\x0E-\\x1F]+|\\s+','')进一步对不可见字符进行处理。

相关推荐
lkbhua莱克瓦2442 分钟前
基础-函数
开发语言·数据库·笔记·sql·mysql·函数
今天有个Bug1 小时前
【计算机毕业设计】流浪动物救助平台 - SpringBoot+Vue
sql·mysql·spring·vue·毕业设计·课程设计
l1t4 小时前
一个postgresql奇怪慢查询现象的原因和解决
数据库·sql·postgresql·性能优化
默 语5 小时前
Spring Boot 3.x升级踩坑记:到底值不值得升级?
hive·spring boot·后端
lkbhua莱克瓦248 小时前
基础-SQL-DML
开发语言·数据库·笔记·sql·mysql
l1t9 小时前
PostgreSQL Distinct On 关键字的用法
数据库·sql·postgresql
2401_8322981010 小时前
云服务器 vs 传统物理服务器,企业该如何选择?
sql
安且惜10 小时前
根据正则表达式生成字符串
正则表达式
ha_lydms11 小时前
4、Spark 函数_m/n/o/p/q/r
大数据·数据库·python·sql·spark·数据处理·dataworks
ha_lydms12 小时前
2、Spark 函数_a/b/c
大数据·c语言·hive·spark·时序数据库·dataworks·数据开发