Clickhouse 字符串函数 - 1

empty

对于空字符串返回1,对于非空字符串返回0。 结果类型是UInt8。 如果字符串包含至少一个字节,则该字符串被视为非空字符串,即使这是一个空格或空字符。 该函数也适用于数组。

notEmpty

对于空字符串返回0,对于非空字符串返回1。 结果类型是UInt8。 该函数也适用于数组。

length

返回字符串的字节长度。 结果类型是UInt64。 该函数也适用于数组。

lengthUTF8

假定字符串以UTF-8编码组成的文本,返回此字符串的Unicode字符长度。如果传入的字符串不是UTF-8编码,则函数可能返回一个预期外的值(不会抛出异常)。 结果类型是UInt64。

char_length,CHAR_LENGTH

假定字符串以UTF-8编码组成的文本,返回此字符串的Unicode字符长度。如果传入的字符串不是UTF-8编码,则函数可能返回一个预期外的值(不会抛出异常)。 结果类型是UInt64。

character_length,CHARACTER_LENGTH

假定字符串以UTF-8编码组成的文本,返回此字符串的Unicode字符长度。如果传入的字符串不是UTF-8编码,则函数可能返回一个预期外的值(不会抛出异常)。 结果类型是UInt64。

lower, lcase

将字符串中的ASCII转换为小写。

upper, ucase

将字符串中的ASCII转换为大写。

lowerUTF8

将字符串转换为小写,函数假设字符串是以UTF-8编码文本的字符集。 同时函数不检测语言。因此对土耳其人来说,结果可能不完全正确。 如果UTF-8字节序列的长度对于代码点的大写和小写不同,则该代码点的结果可能不正确。 如果字符串包含一组非UTF-8的字节,则将引发未定义行为。

upperUTF8

将字符串转换为大写,函数假设字符串是以UTF-8编码文本的字符集。 同时函数不检测语言。因此对土耳其人来说,结果可能不完全正确。 如果UTF-8字节序列的长度对于代码点的大写和小写不同,则该代码点的结果可能不正确。 如果字符串包含一组非UTF-8的字节,则将引发未定义行为。

isValidUTF8

检查字符串是否为有效的UTF-8编码,是则返回1,否则返回0。

toValidUTF8

(U+FFFD)字符替换无效的UTF-8字符。所有连续的无效字符都会被替换为一个替换字符。

toValidUTF8( input_string )

参数:

  • input_string --- 任何一个字符串类型的对象。

返回值: 有效的UTF-8字符串。

示例

SELECT toValidUTF8('\x61\xF0\x80\x80\x80b')

┌─toValidUTF8('a����b')─┐
│ a�b                   │
└───────────────────────┘

reverse

反转字符串。

相关推荐
吹老师个人app编程教学11 小时前
clickhouse-题库
clickhouse
fusugongzi11 小时前
clickhouse一直重启,日志提示structure needs cleaning
clickhouse
arnold6613 小时前
深入探索 ClickHouse:性能优化之道
clickhouse·性能优化
孤独天狼2 天前
Clickhouse(Centos)
clickhouse
Favor_Yang2 天前
C# 连接ClickHouse 数据库
数据库·clickhouse·c#
fusugongzi3 天前
clickhouse优化记录
clickhouse
吹老师个人app编程教学3 天前
clickhouse-副本和分片
java·服务器·clickhouse
天地风雷水火山泽4 天前
二百七十九、ClickHouse——用Kettle对DWD层清洗数据进行增量补全
clickhouse
天地风雷水火山泽4 天前
二百八十、ClickHouse——用Kettle对DWD层补全的清洗数据进行记录
大数据·clickhouse·kettle
wending-Y4 天前
clickhouse 查询优化思路
clickhouse