Clickhouse 字符串函数 - 1

empty

对于空字符串返回1,对于非空字符串返回0。 结果类型是UInt8。 如果字符串包含至少一个字节,则该字符串被视为非空字符串,即使这是一个空格或空字符。 该函数也适用于数组。

notEmpty

对于空字符串返回0,对于非空字符串返回1。 结果类型是UInt8。 该函数也适用于数组。

length

返回字符串的字节长度。 结果类型是UInt64。 该函数也适用于数组。

lengthUTF8

假定字符串以UTF-8编码组成的文本,返回此字符串的Unicode字符长度。如果传入的字符串不是UTF-8编码,则函数可能返回一个预期外的值(不会抛出异常)。 结果类型是UInt64。

char_length,CHAR_LENGTH

假定字符串以UTF-8编码组成的文本,返回此字符串的Unicode字符长度。如果传入的字符串不是UTF-8编码,则函数可能返回一个预期外的值(不会抛出异常)。 结果类型是UInt64。

character_length,CHARACTER_LENGTH

假定字符串以UTF-8编码组成的文本,返回此字符串的Unicode字符长度。如果传入的字符串不是UTF-8编码,则函数可能返回一个预期外的值(不会抛出异常)。 结果类型是UInt64。

lower, lcase

将字符串中的ASCII转换为小写。

upper, ucase

将字符串中的ASCII转换为大写。

lowerUTF8

将字符串转换为小写,函数假设字符串是以UTF-8编码文本的字符集。 同时函数不检测语言。因此对土耳其人来说,结果可能不完全正确。 如果UTF-8字节序列的长度对于代码点的大写和小写不同,则该代码点的结果可能不正确。 如果字符串包含一组非UTF-8的字节,则将引发未定义行为。

upperUTF8

将字符串转换为大写,函数假设字符串是以UTF-8编码文本的字符集。 同时函数不检测语言。因此对土耳其人来说,结果可能不完全正确。 如果UTF-8字节序列的长度对于代码点的大写和小写不同,则该代码点的结果可能不正确。 如果字符串包含一组非UTF-8的字节,则将引发未定义行为。

isValidUTF8

检查字符串是否为有效的UTF-8编码,是则返回1,否则返回0。

toValidUTF8

(U+FFFD)字符替换无效的UTF-8字符。所有连续的无效字符都会被替换为一个替换字符。

复制代码
toValidUTF8( input_string )

参数:

  • input_string --- 任何一个字符串类型的对象。

返回值: 有效的UTF-8字符串。

示例

复制代码
SELECT toValidUTF8('\x61\xF0\x80\x80\x80b')

┌─toValidUTF8('a����b')─┐
│ a�b                   │
└───────────────────────┘

reverse

反转字符串。

相关推荐
zhangyifang_0091 天前
ClickHouse查询报错:Code: 62. DB::Exception: Max query size exceeded:
数据库·clickhouse
HideInTime1 天前
Clickhouse进阶分组复合排序查询
clickhouse
memgLIFE2 天前
clickhouse
clickhouse
Arbori_262153 天前
clickhouse 实现mysql GROUP_CONCAT() 函数
数据库·mysql·clickhouse
斯普信专业组4 天前
Nomad组件部署clickhouse-job
clickhouse·nomad
麦兜和小可的舅舅4 天前
ClickHouse Drop Table On Cluster 故障分析和原理解析
clickhouse·kafka
重生之绝世牛码6 天前
Linux软件安装 —— ClickHouse单节点安装(rpm安装、tar安装两种安装方式)
大数据·linux·运维·数据库·clickhouse·软件安装·clickhouse单节点
麦兜和小可的舅舅6 天前
Spark to ClickHouse由于DNS问题导致Stage重试的Task竞态分析和问题解决过程
clickhouse·spark
重生之绝世牛码6 天前
Linux软件安装 —— ClickHouse集群安装(集成Zookeeper)+ chproxy负载均衡
大数据·linux·数据库·clickhouse·软件安装·clickhouse集群安装·clickhouse负载均衡
无级程序员8 天前
clickhouse创建用户,登录出错的问题,code 516
linux·服务器·clickhouse