【postgresql初级使用】基于表达式或者函数的索引,字符串拼接可以使用索引了,带来不一样的优化效果

带表达式的索引

专栏内容

文章目录

概述


在postgresql 中,一个索引不仅仅是基于表的一列或多列来创建,还可以基于函数,或者一个表达式来创建。

本文就来分享在postgresql 如何基于表达式来创建索引。

创建语法


基于表达式创建索引,它的SQL语法如下所示:

sql 复制代码
CREATE INDEX index_name 
ON table_name (expression);
  • index_name 指定当前索引的名称 ;
  • ON子句 指定当前索引 引用的数据表;
  • expression 指定表达式内容;普通索引这里指定的是列名;

场景分析


在大数据时代,查询语句各式各样,过滤条件中带有函数,字符拼接等等,组成各种条件变量,下面我们按不同场景来举例说明。

函数表达式

经常会遇到将字符串转换为小字,或者在大小写不敏感时,就可以转换为大写或者小写,再来比较。

有一张人员信息表,名字分为first_name,last_name两部分,而名字又是大小字不敏感,所以经常转换为小写字符来比较。

sql 复制代码
postgres=> create table userInfo (uid integer primary key, first_name varchar, last_name varchar);
CREATE TABLE

postgres=> INSERT INTO userinfo(uid, first_name, last_name)
select id, 'firstname' || id::int, 'lastname'||id::int FROM generate_series(1, 100000) as id;
INSERT 0 100000

表中插入了10万条测试数据。

经常使用的SQL查询如下。

sql 复制代码
select * from userinfo where lower(first_name) = 'mar';

其中就用到了函数转换,先将first_name转为小写,再参与条件比较。

看一下它的执行计划。

shell 复制代码
postgres=> explain select * from userinfo where lower(first_name) = 'mar';
                          QUERY PLAN
--------------------------------------------------------------
 Seq Scan on userinfo  (cost=0.00..2324.00 rows=500 width=31)
   Filter: (lower((first_name)::text) = 'mar'::text)
(2 rows)

可以看到它使用了seq scan也就是顺序扫描,从表起始一条条进行遍历,如果此类查询非常频繁的话,相当损耗性能。

这里使用带有表达式的索引尝试来优化一下。

sql 复制代码
postgres=> explain select * from userinfo where lower(first_name) = 'mar';
                                     QUERY PLAN
------------------------------------------------------------------------------------
 Index Scan using idx_expre_userinfo on userinfo  (cost=0.42..8.44 rows=1 width=31)
   Index Cond: (lower((first_name)::text) = 'mar'::text)
(2 rows)

可以看到执行计划中,使用到了刚才创建的索引,而且执行估算时间也是大幅提升。

普通表达式

继续使用上面的测试数据来看另外一种场景。

当我们需要查询某个用户名是否存在时,会经常使用如下SQL语句。

sql 复制代码
postgres=> select * from userinfo where (first_name || ' ' || last_name) = 'firstname9999 lastname9999';
 uid  |  first_name   |  last_name
------+---------------+--------------
 9999 | firstname9999 | lastname9999
(1 row)

Time: 7.905 ms
postgres=> explain select * from userinfo where (first_name || ' ' || last_name) = 'firstname9999 lastname9999';
                                                QUERY PLAN
-----------------------------------------------------------------------------------------------------------
 Seq Scan on userinfo  (cost=0.00..2574.00 rows=500 width=31)
   Filter: ((((first_name)::text || ' '::text) || (last_name)::text) = 'firstname9999 lastname9999'::text)
(2 rows)

Time: 0.234 ms

筛选条件中,先将first_name和last_name拼接起来,再进行比较。

可以看到执行计划中使用了顺序扫描方式,执行时间也到了毫秒级,同样使用表达式索引来优化一下。

sql 复制代码
postgres=> create index idx_userinfo_name on userinfo ((first_name || ' ' || last_name));
CREATE INDEX
Time: 307.842 ms

创建一个基于名字拼接表达式的索引。

下面再来看一下查询计划的情况。

shell 复制代码
postgres=> explain select * from userinfo where (first_name || ' ' || last_name) = 'firstname9999 lastname9999';
                                                     QUERY PLAN
---------------------------------------------------------------------------------------------------------------------
 Bitmap Heap Scan on userinfo  (cost=20.29..778.62 rows=500 width=31)
   Recheck Cond: ((((first_name)::text || ' '::text) || (last_name)::text) = 'firstname9999 lastname9999'::text)
   ->  Bitmap Index Scan on idx_userinfo_name  (cost=0.00..20.17 rows=500 width=0)
         Index Cond: ((((first_name)::text || ' '::text) || (last_name)::text) = 'firstname9999 lastname9999'::text)
(4 rows)

Time: 0.366 ms

可以看到刚才创建的索引被使用了 Bitmap Index Scan on idx_userinfo_name, 采用了bitmap扫描的方式;

下面看一下执行时间的变化。

sql 复制代码
postgres=> select * from userinfo where (first_name || ' ' || last_name) = 'firstname9999 lastname9999';
 uid  |  first_name   |  last_name
------+---------------+--------------
 9999 | firstname9999 | lastname9999
(1 row)

Time: 0.274 ms

执行时间的提升,真得令人惊㤉,提升了二十来倍。

总结


以上就是本节的全部内容,在复杂的SQL查询中,经常会用到各种表达式,字符运算,时间运算等,此时可以使用基于表达式或者函数的索引,使用索引进行优化效率。

结尾


非常感谢大家的支持,在浏览的同时别忘了留下您宝贵的评论,如果觉得值得鼓励,请点赞,收藏,我会更加努力!

作者邮箱:study@senllang.onaliyun.com

如有错误或者疏漏欢迎指出,互相学习。

注:未经同意,不得转载!

相关推荐
cui_ruicheng5 小时前
MySQL(四):数据类型与字段设计
数据库·mysql
皮皮学姐分享-ppx5 小时前
政府绿色采购数据库(2015-2024.3)
大数据·网络·数据库·人工智能·制造
闪电悠米7 小时前
黑马点评-Redis 消息队列-03_stream_consumer_group
开发语言·数据库·redis·分布式·缓存·junit·lua
DIY源码阁8 小时前
JavaSwing航班订票管理系统 - MySQL版
数据库·mysql
浪客灿心9 小时前
项目篇:模块设计与实现
数据库·c++
流星白龙10 小时前
【MySQL高阶】26.事务(1)
数据库·mysql
三十..11 小时前
Redis 核心原理与高可用架构实践
运维·数据库·redis
这个DBA有点耶11 小时前
索引优化深潜(下):索引合并、ICP 与索引设计的实战法则
数据库·mysql·架构
努力努力再努力wz12 小时前
【内存管理与高并发内存池系列】从 mmap 到 malloc:文件映射、匿名映射与 glibc 内存分配机制详解
linux·c语言·数据结构·数据库·c++·qt·链表
Theo·Chan12 小时前
机房断电搞崩服务器 | 人大金仓 V8 全量备份跨实例完整恢复实录
sql·信创·kingbase·金仓