HIVE SQL中替换不可见字符的正则表达式

一.替换字符串中的空白字符

对于剔除字符串首尾的空格,使用较多的是trim()ltrim()rtrim()函数,但是他们无法去除字符串中间的空格。

这个时候通常会使用正则表达式来替换字符串中的空白字符\s表示匹配任何空白字符,包括空格、制表符、换页符等等, 等价于[ \f\n\r\t\v]。

c 复制代码
select regexp_replace('  abcd  ef  g ','\\s+','');

返回结果:

'abcdefg'

二.替换字符串中的无法解析的非法字符

在实际清洗过程中,发现即使使用了'\\s+'正则进行替换后,仍旧出现字符串中存在不可见字符的情况。这往往是因为上有数据在解析过程中未将无法解析的非法字符剔除掉。

这个时候可以使用regexp_replace(col_name,'[\\x00-\\x08\\x0B-\\x0C\\x0E-\\x1F]+|\\s+','')进一步对不可见字符进行处理。

相关推荐
阳光九叶草LXGZXJ21 小时前
达梦数据库-学习-48-DmDrs控制台命令(同步之Manager、CPT模块)
linux·运维·数据库·sql·学习
亓才孓1 天前
[数据库]应该注意的细节
数据库·sql
我真的是大笨蛋1 天前
Redo Log详解
java·数据库·sql·mysql·性能优化
Root_Hacker1 天前
sql注入学习笔记
数据库·sql·web安全·网络安全·oracle·网络攻击模型
hamawari1 天前
SQL语法
数据库·sql·oracle
晚霞的不甘1 天前
Flutter for OpenHarmony从基础到专业:深度解析新版番茄钟的倒计时优化
android·flutter·ui·正则表达式·前端框架·鸿蒙
invicinble1 天前
对于mysql层对sql层面的知识体系的理解和把握
数据库·sql·mysql
l1t1 天前
DeepSeek辅助总结postgresql wiki提供的数独求解器
数据库·sql·postgresql
万行1 天前
SQL进阶&索引篇
开发语言·数据库·人工智能·sql