HIVE SQL中替换不可见字符的正则表达式

一.替换字符串中的空白字符

对于剔除字符串首尾的空格,使用较多的是trim()ltrim()rtrim()函数,但是他们无法去除字符串中间的空格。

这个时候通常会使用正则表达式来替换字符串中的空白字符\s表示匹配任何空白字符,包括空格、制表符、换页符等等, 等价于[ \f\n\r\t\v]。

c 复制代码
select regexp_replace('  abcd  ef  g ','\\s+','');

返回结果:

'abcdefg'

二.替换字符串中的无法解析的非法字符

在实际清洗过程中,发现即使使用了'\\s+'正则进行替换后,仍旧出现字符串中存在不可见字符的情况。这往往是因为上有数据在解析过程中未将无法解析的非法字符剔除掉。

这个时候可以使用regexp_replace(col_name,'[\\x00-\\x08\\x0B-\\x0C\\x0E-\\x1F]+|\\s+','')进一步对不可见字符进行处理。

相关推荐
懒虫虫~12 小时前
通过内存去重替换SQL中distinct,优化SQL查询效率
java·sql·慢sql治理
逛逛GitHub12 小时前
1 个神级智能问数工具,刚开源就 1500 Star 了。
sql·github
Huhbbjs13 小时前
SQL 核心概念与实践总结
开发语言·数据库·sql
咋吃都不胖lyh13 小时前
SQL-字符串函数、数值函数、日期函数
sql
sensenlin9114 小时前
Mybatis中SQL全大写或全小写影响执行性能吗
数据库·sql·mybatis
半梦半醒*14 小时前
正则表达式
linux·运维·开发语言·正则表达式·centos·运维开发
xqlily18 小时前
SQL 数据库简介
数据库·sql
PyHaVolask18 小时前
Python进阶教程:随机数、正则表达式与异常处理
python·正则表达式·异常处理·随机数生成
森林-18 小时前
MyBatis 从入门到精通(第三篇)—— 动态 SQL、关联查询与查询缓存
sql·缓存·mybatis
小虾米vivian18 小时前
达梦:将sql通过shell脚本的方式放在后台执行
服务器·数据库·sql