HIVE SQL中替换不可见字符的正则表达式

一.替换字符串中的空白字符

对于剔除字符串首尾的空格,使用较多的是trim()ltrim()rtrim()函数,但是他们无法去除字符串中间的空格。

这个时候通常会使用正则表达式来替换字符串中的空白字符\s表示匹配任何空白字符,包括空格、制表符、换页符等等, 等价于[ \f\n\r\t\v]。

c 复制代码
select regexp_replace('  abcd  ef  g ','\\s+','');

返回结果:

'abcdefg'

二.替换字符串中的无法解析的非法字符

在实际清洗过程中,发现即使使用了'\\s+'正则进行替换后,仍旧出现字符串中存在不可见字符的情况。这往往是因为上有数据在解析过程中未将无法解析的非法字符剔除掉。

这个时候可以使用regexp_replace(col_name,'[\\x00-\\x08\\x0B-\\x0C\\x0E-\\x1F]+|\\s+','')进一步对不可见字符进行处理。

相关推荐
Jan123.5 分钟前
数据库性能优化实战:从索引到SQL的全维度进阶
数据库·sql·性能优化
WZTTMoon8 分钟前
MyBatis SQL执行流程详解
sql·mybatis
FJW0208149 分钟前
Python正则表达式
python·正则表达式
麦聪聊数据13 分钟前
金融级数据库运维的“零信任”实践:如何在合规与效率间寻找平衡点?
运维·数据库·后端·sql·金融
消失的旧时光-194322 分钟前
第六课 · 6.1 从 JDBC 到 MyBatis:SQL 工程化是如何发生的?
java·sql·mybatis
咸鱼翻身小阿橙1 小时前
SQL上半部分
服务器·数据库·sql
枷锁—sha1 小时前
【CTF笔记篇】SQL 注入总结
数据库·笔记·sql·安全·网络安全
薛定谔的猫喵喵1 小时前
【从零构建】PHP网络安全渗透测试靶场:5大基础漏洞实战
windows·sql·web安全·php
weixin_531651812 小时前
Java 正则表达式
java·正则表达式
Hello.Reader2 小时前
Flink DataGen SQL Connector 本地造数、压测、边界数据与“像真数据”的生成技巧
大数据·sql·flink