HIVE SQL中替换不可见字符的正则表达式

一.替换字符串中的空白字符

对于剔除字符串首尾的空格,使用较多的是trim()ltrim()rtrim()函数,但是他们无法去除字符串中间的空格。

这个时候通常会使用正则表达式来替换字符串中的空白字符\s表示匹配任何空白字符,包括空格、制表符、换页符等等, 等价于[ \f\n\r\t\v]。

c 复制代码
select regexp_replace('  abcd  ef  g ','\\s+','');

返回结果:

'abcdefg'

二.替换字符串中的无法解析的非法字符

在实际清洗过程中,发现即使使用了'\\s+'正则进行替换后,仍旧出现字符串中存在不可见字符的情况。这往往是因为上有数据在解析过程中未将无法解析的非法字符剔除掉。

这个时候可以使用regexp_replace(col_name,'[\\x00-\\x08\\x0B-\\x0C\\x0E-\\x1F]+|\\s+','')进一步对不可见字符进行处理。

相关推荐
少年攻城狮5 小时前
Mybatis-Plus系列---【自定义拦截器实现sql完整拼接及耗时打印】
数据库·sql·mybatis
迷茫的21世纪的新轻年6 小时前
PostgreSQL——SQL优化
数据库·sql·postgresql
2301_800256116 小时前
8.3 查询优化 核心知识点总结
大数据·数据库·人工智能·sql·postgresql
MM_MS9 小时前
MYSQl数据库详细知识点和在Navicat中的具体操作
开发语言·数据库·sql·mysql·oracle
爱吃土豆的马铃薯ㅤㅤㅤㅤㅤㅤㅤㅤㅤ10 小时前
sql计算去除值后面的零
数据库·sql
ChrylZzz10 小时前
【SQL】大小表查询、更新表语句
数据库·sql
爱尔兰极光10 小时前
数据库基本操作(下)
数据库·sql
笨蛋少年派10 小时前
Sqoop数据迁移简介
hive·hadoop·sqoop
古城小栈12 小时前
Golang Gin+Gorm :SQL注入 防护
sql·安全·go·gin
云闲不收12 小时前
clickhouse hbase Hive 区别
hive·clickhouse·hbase