文章目录
本文讲解一下hive数据库中字符串拼接的几种方式。
一、||字符串连接符
||
操作符要求所有参与连接的操作数都是字符串类型。
实测后发现所有参与连接的字段必须有一个是字符串string类型,若所有的都非字符串类型,则会报错。
示例如下:
sql
1.查询时拼接两个字段(ps: 需要保证两个字段都是字符串类型,否则可能会报错)
select name||class from user;
select 'Hello'||' World'
-- || 连接多个字段
select 'Hello'||' World'||'你好'
select null||'hello' -- hello 当空与字符串一起拼接时,返回字符串
1.1、常见报错
若||
操作符两边全都非string类型,则会报错TProtocolException: Required field 'type' is unset
sql
org.apache.thrift.protocol.TProtocolException:
Required field 'type' is unset! Struct:TPrimitiveTypeEntry(type:null,
typeQualifiers:TTypeQualifiers(qualifiers:{characterMaximumLength=}))
解决方法参见:《https://blog.csdn.net/weixin_49114503/article/details/142853037》
报错示例:
sql
select 1||1 -- 因为两边都不是string类型,所以会报错
select 1.45||3 -- 因为两边都不是string类型,所以会报错
正确示例:
sql
select 'hello'||' World'
select 'hello'|| 1.00 -- ||操作符两边必须有一个是字符串类型
二、concat(str1,str2,str3,...)
concat(str1,str2,str3...): 连接参数的函数,返回结果为连接参数的字符串。如果有参数为NULL,则忽略该参数。
注意:传入参数不能全是非字符串类型,否则会报错
语法如下:
sql
可以连接多个字符
concat(string:VARCHAR,string:VARCHAR*)
示例如下:
sql
-- concat连接多个字段
SELECT CONCAT('Hello', ', ', 'World') FROM your_table;
-- concat嵌套连接多个字段
SELECT CONCAT(CONCAT('Hello', ', '), CONCAT('World', '!')) FROM your_table;
-- 若有参数为null, 则忽略该参数,其他的进行拼接
select concat('a',null,'c') --- ac
-- concat函数中必须有一个是字符串类型,否则会报错。 所以尽量都传入字符串类型,虽然下列的方式不会报错
select concat('1',2) --- 12
-- 若所有的参数都是非字符串类型,则抛错
select concat(1,2) --- 抛错Required field 'type' is unset!
三、concat_ws('分隔符',str1,str2,...)
concat()的一个特殊形式,表示concat with separator,两个参数之间加上特定的分隔符。返回的是用指定分隔符连接参数的字符串。如果分割符为null,则返回null,参数为null,则忽略该参数。
注意:concat_ws所有参数必须都是字符串类型,不能有数字类型
示例如下:
sql
select concat_ws('/','2018','12','19')----2018/12/19
-- 若参数为null, 则忽略该参数
select concat_ws(':','22','47',null)----22:47
-- 若分隔符为null, 则返回null
select concat_ws(null,'22','47')----null
-- concat_ws的参数必须是string类型,否则会报错
select concat_ws(':','22',47)----报错 [42000][10632] COMPILE FAILED:Semantic error:[Error 10632] Argument 3 of function CONCAT_WS must be 'string or array <string>', but 'int' was found.