HIVE SQL中替换不可见字符的正则表达式

一.替换字符串中的空白字符

对于剔除字符串首尾的空格,使用较多的是trim()ltrim()rtrim()函数,但是他们无法去除字符串中间的空格。

这个时候通常会使用正则表达式来替换字符串中的空白字符\s表示匹配任何空白字符,包括空格、制表符、换页符等等, 等价于[ \f\n\r\t\v]。

c 复制代码
select regexp_replace('  abcd  ef  g ','\\s+','');

返回结果:

'abcdefg'

二.替换字符串中的无法解析的非法字符

在实际清洗过程中,发现即使使用了'\\s+'正则进行替换后,仍旧出现字符串中存在不可见字符的情况。这往往是因为上有数据在解析过程中未将无法解析的非法字符剔除掉。

这个时候可以使用regexp_replace(col_name,'[\\x00-\\x08\\x0B-\\x0C\\x0E-\\x1F]+|\\s+','')进一步对不可见字符进行处理。

相关推荐
brevity_souls2 小时前
SQL 中 BETWEEN 和 IN 的区别
数据库·sql
驾数者2 小时前
Flink SQL容错机制:Checkpoint与Savepoint实战解析
大数据·sql·flink
cyhysr5 小时前
2025sql大赛题:仅用sql处理数独
数据库·sql·oracle
SelectDB技术团队6 小时前
驾驭 CPU 与编译器:Apache Doris 实现极致性能的底层逻辑
数据库·数据仓库·人工智能·sql·apache
tc&7 小时前
为什么 Kamailio 模块封装的 MySQL 函数能有效防范 SQL 注入?
数据库·sql·mysql·网络攻击模型·kamailio
噎住佩奇7 小时前
正则表达式(Regex)入门
运维·正则表达式
心丑姑娘9 小时前
使用ClickHouse时的劣质SQL样例
数据库·sql·clickhouse
lkbhua莱克瓦2410 小时前
进阶-存储对象2-存储过程上
java·开发语言·数据库·sql·mysql
lkbhua莱克瓦2410 小时前
进阶-存储对象1-视图
java·数据库·sql·mysql·视图
brevity_souls12 小时前
SQL 中“过滤条件”写在 SELECT、JOIN 和 WHERE 的区别
数据库·sql