Clickhouse 字符串函数 - 1

empty

对于空字符串返回1,对于非空字符串返回0。 结果类型是UInt8。 如果字符串包含至少一个字节,则该字符串被视为非空字符串,即使这是一个空格或空字符。 该函数也适用于数组。

notEmpty

对于空字符串返回0,对于非空字符串返回1。 结果类型是UInt8。 该函数也适用于数组。

length

返回字符串的字节长度。 结果类型是UInt64。 该函数也适用于数组。

lengthUTF8

假定字符串以UTF-8编码组成的文本,返回此字符串的Unicode字符长度。如果传入的字符串不是UTF-8编码,则函数可能返回一个预期外的值(不会抛出异常)。 结果类型是UInt64。

char_length,CHAR_LENGTH

假定字符串以UTF-8编码组成的文本,返回此字符串的Unicode字符长度。如果传入的字符串不是UTF-8编码,则函数可能返回一个预期外的值(不会抛出异常)。 结果类型是UInt64。

character_length,CHARACTER_LENGTH

假定字符串以UTF-8编码组成的文本,返回此字符串的Unicode字符长度。如果传入的字符串不是UTF-8编码,则函数可能返回一个预期外的值(不会抛出异常)。 结果类型是UInt64。

lower, lcase

将字符串中的ASCII转换为小写。

upper, ucase

将字符串中的ASCII转换为大写。

lowerUTF8

将字符串转换为小写,函数假设字符串是以UTF-8编码文本的字符集。 同时函数不检测语言。因此对土耳其人来说,结果可能不完全正确。 如果UTF-8字节序列的长度对于代码点的大写和小写不同,则该代码点的结果可能不正确。 如果字符串包含一组非UTF-8的字节,则将引发未定义行为。

upperUTF8

将字符串转换为大写,函数假设字符串是以UTF-8编码文本的字符集。 同时函数不检测语言。因此对土耳其人来说,结果可能不完全正确。 如果UTF-8字节序列的长度对于代码点的大写和小写不同,则该代码点的结果可能不正确。 如果字符串包含一组非UTF-8的字节,则将引发未定义行为。

isValidUTF8

检查字符串是否为有效的UTF-8编码,是则返回1,否则返回0。

toValidUTF8

(U+FFFD)字符替换无效的UTF-8字符。所有连续的无效字符都会被替换为一个替换字符。

复制代码
toValidUTF8( input_string )

参数:

  • input_string --- 任何一个字符串类型的对象。

返回值: 有效的UTF-8字符串。

示例

复制代码
SELECT toValidUTF8('\x61\xF0\x80\x80\x80b')

┌─toValidUTF8('a����b')─┐
│ a�b                   │
└───────────────────────┘

reverse

反转字符串。

相关推荐
爱吃萝卜的猪17 小时前
Clickhouse源码分析-副本数据同步
clickhouse·源码解析·副本同步
努力做一名技术17 小时前
从 Elastic 到 ClickHouse:日志系统性能与成本优化之路
clickhouse
白眼黑刺猬17 小时前
ClickHouse 高性能实时分析数据库-物化视图篇
clickhouse
Fireworkitte17 小时前
ClickHouse 常用的使用场景
clickhouse
小牛头#17 天前
clickhouse 各个引擎适用的场景
大数据·clickhouse·机器学习
全干engineer17 天前
ClickHouse 入门详解:它到底是什么、优缺点、和主流数据库对比、适合哪些场景?
数据库·clickhouse
爱吃萝卜的猪17 天前
Clickhouse诊断工具之chdig
clickhouse
源图客17 天前
ClickHouse介绍与应用
clickhouse
码农周17 天前
ClickHouse 时间范围查询:精准筛选「本月数据」
clickhouse
积跬步,慕至千里19 天前
clickhouse数据库表和doris数据库表迁移starrocks数据库时建表注意事项总结
数据库·clickhouse