HIVE SQL中替换不可见字符的正则表达式

一.替换字符串中的空白字符

对于剔除字符串首尾的空格,使用较多的是trim()ltrim()rtrim()函数,但是他们无法去除字符串中间的空格。

这个时候通常会使用正则表达式来替换字符串中的空白字符\s表示匹配任何空白字符,包括空格、制表符、换页符等等, 等价于[ \f\n\r\t\v]。

c 复制代码
select regexp_replace('  abcd  ef  g ','\\s+','');

返回结果:

'abcdefg'

二.替换字符串中的无法解析的非法字符

在实际清洗过程中,发现即使使用了'\\s+'正则进行替换后,仍旧出现字符串中存在不可见字符的情况。这往往是因为上有数据在解析过程中未将无法解析的非法字符剔除掉。

这个时候可以使用regexp_replace(col_name,'[\\x00-\\x08\\x0B-\\x0C\\x0E-\\x1F]+|\\s+','')进一步对不可见字符进行处理。

相关推荐
香气袭人知骤暖1 小时前
SQL慢查询常见优化步骤
android·数据库·sql
Star Learning Python1 小时前
MySQL日期时间的处理函数
数据库·sql
醇氧5 小时前
SqlLogInterceptor mybatis配置打印SQL
java·sql·mybatis
lipWOFb5 小时前
扩展卡尔曼滤波soc估算 基于EKF算法的锂电池SOC 卡尔曼滤波估计电池soc ,simul...
hive
清风拂山岗 明月照大江6 小时前
MySQL进阶
数据库·sql·mysql
知识分享小能手7 小时前
Oracle 19c入门学习教程,从入门到精通,SQL*Plus命令详解:语法、使用方法与综合案例 -知识点详解(4)
sql·学习·oracle
永远是我的最爱8 小时前
基于ASP.NET的图书管理系统的设计与实现
前端·后端·sql·visual studio
走遍西兰花.jpg9 小时前
hive如何使用python脚本
数据仓库·hive·hadoop·python
德彪稳坐倒骑驴9 小时前
Hive电商分析项目 Azkaban自动化运行
hive·hadoop·自动化
阳光九叶草LXGZXJ10 小时前
达梦数据库-报错-06-[-502]OUT OF TEMPORARY DATABASE SPACE(临时表空间不足)
linux·运维·数据库·sql·学习