PostgreSQL——索引

PostgreSQL索引

一、索引简介

1.1、索引的含义和特点

索引是一个单独的、存储在磁盘上的数据库结构,它们包含着对数据表里所有记录的引用指针。使用索引可以快速找出在某个或多个列中有一特定值的行,所有PostgreSQL列类型都可以被索引,对相关列使用索引是提高查询操作效率的最佳途径。

例如:数据库中有2万条记录,现在要执行这样一个查询:SELECT*FROM table where num=10000。如果没有索引,必须遍历整个表,直到num等于10000的这一行被找到为止:如果在num列上创建索引,PostgreSQL不需要任何扫描,直接在索引里面找10000,就可以得知这一行的位置。可见,索引的建立可以提高数据库的查询速度。

索引是在存储引擎中实现,因此,每种存储引擎的索引都不一定完全相同,并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引,总索引长度至少为256字节。大多数存储引擎有更高的限制。

索引的优点主要以下几条:

  • 通过创建唯一索引,可以保证数据库表中每一行数据的唯一性。
  • 可以大大提高数据的查询速度,这也是创建索引的最主要原因
  • 在实现数据的参考完整性方面,可以加速表和表之间的连接。
  • 在使用分组和排序子句进行数据查询时,也可以显著减少查询中分组和排序的时间,

增加索引也有许多不利的方面,主要表现在如下几个方面:

  • 创建索引和维护索引要耗费时间,并且随着数据量的增加所耗贵的时间也会增加。
  • 索引需要占磁盘空间,除了数据表占数据空间之外,每一个索引还要占一定的物理空间
  • 如果有大量的索引,索引文件可能比数据文件更快达到最大文件尺寸。
  • 当对表中的数据进行增加、删除和修改的时候,索引也要动态地雏护,这样就降低了数据的维护速度

1.2、索引的分类

PostgreSQL提供了索引类型有:B-tree、Hash、GiST和GN。因为它们各自的算法不同,所以适用情况也不相同。大多数情况下,B-tee索引比较常用,用户可以使用CREATE INDEX命令来创建一个B-tree索引。

1.2.1、B-tree索引

B-tree适合处理那些能够按顺序存储的数据,比如对于一些字段涉及到使用"<"、"<="、"="、">="或">"操作符进行比较的时候,可以建立一个索引。

1.2.2、Hash索引

Hsh索引只能处理简单的等于比较。当一个索引了的列涉及到使用"="操作符进行比较时,查询规划器会考虑使用Hash索引。

下面的命令用于创建Hash索引:

sql 复制代码
CREATE INDEX name ON table USING hash (column);

PostgreSQL的Hash索引的性能比B-tree索引弱,而且Hash索引操作目前没有记录WAL日志,因此如果发生了数据库崩溃,可能需要使用REINDEX重建Hash索引.为此,不建议用户使用Hash索引.

1.2.3、GiST索引

GST索引不只是一种索引类型,还是一种架构,可以在这种架构上实现很多不同的索引策略。因此,GST索引可以使用的特定操作符类型高度依赖于索引策略(操作符类)。

1.2.4、GIN索引

GN索引是反转索引,它可以处理包含多个键的值(比如数组)。与GiST类似,GN支持用户定义的索引策略,GN索引可以使用的特定操作符类型根据索引策略的不同而不同。

1.3、索引的设计原则

  • 索引并非越多越好,一个表中如果有大量的索引,不仅占用的磁盘空间将增大,而且会影响NSERT、DELETE、UPDATE等语句的性能。因为表中数据更改的同时,索引也会进行调整和更新。
  • 避免对经常更新的表进行过多的索引,并且索引中的列尽可能少,而对经常用于查询的字段应该创建索引,但要避免添加不必要的字段。
  • 数据量小的表最好不要使用索引,由于数据较少,查询花费的时间可能比遍历索引的时间还要短,索引可能不会产生优化效果。
  • 在条件表达式中经常用到的、不同值较多的列上建立检索,在不同值少的列上不要建立索引。比如在学生表的"性别"字段上只有"男"与"女"两个不同值,因此就没必要建立索引。如果建立索引不但不会提高查询效率,反而会严重降低更新速度」
  • 当唯一性是某种数据本身的特征时,指定唯一索引。使用唯一索引能够确保定义的列的数据完整性,提高查询速度,
  • 在频繁进行排序或分组(即进行GROUP BY或ORDER BY操作)的列上建立索引时,如果待排序的列有多个,可以在这些列上建立组合索引。

二、创建索引

使用CREATE INDEX语句在已经存在的表中创建索引,基本语法结构为:

sql 复制代码
CREATE [UNIQUE | FULLTEXT | SPATIAL] INDEX index_name
ON table_name (col_name[length],...) [ASC | DESC]
sql 复制代码
-- 创建表
create table book(
	bookid int not null,
	bookname varchar(255) not null,
	authors varchar(255) not null,
	info varchar(255) null,
	comment varchar(255) null,
	year_pulication date not null
);

2.1、创建普通索引

普通索引是最基本的索引类型,没有唯一性之类的限制,其作用只是加快对数据的访问速度。

sql 复制代码
-- 在book表中的bookname字段上建立名为bknameidx的普通索引
create index bknameidx 
on book(bookname);

2.2、创建唯一索引

创建唯一索引的主要原因是减少查询索引列操作的执行时间,尤其是比较庞大的数据表。它与前面的普通索引类似,不同点就是:索引列的值必须唯一,但允许有空值。如果是组合索引,则列值的组合必须唯一。

sql 复制代码
-- 在book表的bookid字段上建立名称为uniqididx的唯一索引
create unique index uniqididx 
on book(bookid);

2.3、创建单列索引

单列索引是在数据表中的某一个字段上创建的索引,一个表中可以创建多个单列索引。前面两个例子中创建的索引都为单列索引。

sql 复制代码
-- 在book表的comment字段上建立单列索引
create index bkcmtidx 
on book(comment);

2.4、创建组合索引

组合索引是在多个字段上创建一个索引。

sql 复制代码
-- 在book表的authors和info字段上建立组合索引
create index bkauandinfoidx 
on book(authors, info);

三、重命名索引

索引创建之后可以根据需要对数据库中的索引进行重命名操作,常见的方法包括在对象浏览器中修改和使用SQL语句修改。

sql 复制代码
alter index public.bkauandinfoidx rename to xxxxxxidx;

四、删除索引

对于不需要的索引,可以进行删除操作。删除索引的常见方法包括使用对象浏览器删除索和使用SQL语句删除索引。

sql 复制代码
-- 语法
DROP INDEX index_name;
sql 复制代码
-- 别除book表中名称为xxxxxxidx的组合索引
drop index xxxxxxidx;
相关推荐
SelectDB1 小时前
SelectDB x 同辕开发:在 ARM 架构下实现 25% 分析性能提升
大数据·数据库·华为
华科云商xiao徐1 小时前
Rust+Python双核爬虫:高并发采集与智能解析实战
数据库·python·rust
Techie峰1 小时前
Redis Key过期事件监听Java实现
java·数据库·redis
lwb_01182 小时前
【数据库】使用Sql Server创建索引优化查询速度,一般2万多数据后,通过非索引时间字段排序查询出现超时情况
java·服务器·数据库
hj10439 小时前
redis开启局域网访问
数据库·redis·缓存
源代码•宸11 小时前
MySQL 索引:索引为什么使用 B+树?(详解B树、B+树)
数据结构·数据库·经验分享·b树·mysql·b+树·b-树
睡觉的时候不会困11 小时前
MySQL 数据库表操作与查询实战案例
数据库·mysql
秋已杰爱12 小时前
Redis常见命令
数据库·redis·缓存
一个有梦有戏的人12 小时前
软考架构师:数据库的范式
数据库·oracle