【SQL应知应会】表分区(三)• MySQL版

欢迎来到爱书不爱输的程序猿的博客, 本博客致力于知识分享,与更多的人进行学习交流
本文收录于SQL应知应会专栏,本专栏主要用于记录对于数据库的一些学习,有基础也有进阶,有MySQL也有Oracle

分区表 • MySQL版

  • 前言
  • 一、分区表
  • 1.非分区表
  • 2.分区表
    • [2.1 概念](#2.1 概念)
    • [2.2 MySQL数据库表分区](#2.2 MySQL数据库表分区)
      • [2.2.1 InnoDB 逻辑存储结构](#2.2.1 InnoDB 逻辑存储结构)
    • [2.3 MySQL数据库分区的由来](#2.3 MySQL数据库分区的由来)
    • [2.4 为什么对表进行分区?](#2.4 为什么对表进行分区?)
    • [2.5 MySQL的分区形式](#2.5 MySQL的分区形式)
    • [2.6 MySQL分区的类型](#2.6 MySQL分区的类型)
    • [2.7 MySQL分区代码](#2.7 MySQL分区代码)
      • [2.7.3 hash表分区](#2.7.3 hash表分区)
      • [2.7.4 key表分区](#2.7.4 key表分区)
      • 2.7.5复合分区
        • [2.7.5.1 range-hash(范围哈希)复合分区](#2.7.5.1 range-hash(范围哈希)复合分区)
        • [2.7.5.2 list-hash(列表哈希)复合分区](#2.7.5.2 list-hash(列表哈希)复合分区)
  • 小结

前言

在前面的内容中,【SQL应知应会】表分区(一)• MySQL版【SQL应知应会】表分区(二)• MySQL版中,已经完成了MySQL的表分区方面的大部分知识的学习,如为什么对表进行分区,分区有哪些形式,分区有哪些类型以及每一种类型的语句,分区的注意事项以及适用场景,并且用例子代码演示了MySQL的range分区和list分区

今天这篇内容,将继续进行讲述MySQL的表分区的后续内容,其中主要是为了让大家能够在学习知识后可以更加灵活的运用知识,所以今天依旧是讲解例子代码,包括hash(哈希)分区、key表分区、复合分区,其中复合分区有 range-hash(范围哈希)复合分区与list-hash(列表哈希)复合分区

希望文章的内容对大家有所帮助,如果有什么不足的地方,大家可以在评论区或者私信我,感谢大家的支持

那么,快拿出你的电脑,跟着文章一起学习起来吧

一、分区表

1.非分区表

👉:传送门💖非分区表构💖

2.分区表

2.1 概念

👉:传送门💖概念💖

2.2 MySQL数据库表分区

2.2.1 InnoDB 逻辑存储结构

👉:传送门💖InnoDB 逻辑存储结构💖

2.2.2 段(segment)

2.2.3 区(extent)

2.2.4 页(page)

2.3 MySQL数据库分区的由来

👉:传送门💖MySQL数据库分区的由来💖

2.4 为什么对表进行分区?

👉:传送门💖为什么对表进行分区💖

2.4.1 表分区要解决的问题

2.4.2 表分区有如下优点

2.5 MySQL的分区形式

👉:传送门💖MySQL的分区形式💖

2.5.1 水平分区(HorizontalPartitioning)

2.5.2 垂直分区(VerticalPartitioning)

2.6 MySQL分区的类型

👉:传送门💖MySQL分区的类型💖

2.6.1 range分区

2.6.2 list分区(列表分区)

2.6.3 hash分区

2.6.4 KEY表分区

2.6.5 多字段分区(range、list)

2.6.6 分区注意事项及适用场景

2.7 MySQL分区代码

👉:传送门💖MySQL分区代码💖

2.7.1range分区

2.7.2list分区

2.7.3 hash表分区

  • 基于用户定义的表达式的返回值来进行选择的分区,该表达式使用将要插入到表中的这些行的列值进行计算。这个函数可以包含MySQL中有效的、产生非负整数值的任何表达式。
  • HASH分区主要用来确保数据在预先确定数目的分区中平均分布。在RANGE和LIST分区中,必须明确指定一个给定的列值或列值集合应该保存在哪个分区中。
  • 在HASH分区中,MySQL自动完成这些工作,你所要做的只是基于将要被哈希的列值指定一个列值或表达式,以及指定被分区的表将要被分割成的分区数量。
sql 复制代码
create table foo_hash
(
    empno varchar(20) not null,
    ename varchar(20), 
    deptno int,
    salary int
)
partition by hash(deptno)
partition 4;

-- 插入数据
insert into foo_hash values('1','1','1','5000')
insert into foo_hash values('1','2','2','5000')
insert into foo_hash values('1','3','3','5000')
insert into foo_hash values('1','4','4','5000')
insert into foo_hash values('1','5','5','5000')
insert into foo_hash values('1','6','6','5000')
insert into foo_hash values('1','7','7','5000')
insert into foo_hash values('1','8','8','5000')
insert into foo_hash values('1','9','9','5000')
insert into foo_hash values('1','10','10','5000')
insert into foo_hash values('1','11','11','5000')
insert into foo_hash values('1','12','12','5000')

select * from foo_hash partition (p0) -- 系统会自动命名为p0p1p2p3

2.7.4 key表分区

  • 类似于hash分区,区别在于key分区只支持计算一列或多列,且MySQL服务器提供其自身的哈希函数,必须有一列或多列包含整数值
sql 复制代码
create table foo_key
(
	empno varchar(20) not null,
    empname varchar(20),
    deptno int,
    birthdate date not null,
    salary int
)
partition by key(birthdate)
partitions 4;

2.7.5复合分区

  • 基于range/list 类型的分区表中每个分区的再次分割
  • 子分区可以是 hash/key 等类型

2.7.5.1 range-hash(范围哈希)复合分区

sql 复制代码
## range-hash(范围哈希)复合分区
create table  foo_emp
(
    empno varchar(20) not null,
    deptno int,
    salary int
)
partition by range(salary)  -- 主分区,一级分区
subpartition by hash(deptno) -- 子分区,二级分区
subpartitions 3(  -- 子分区的个数是3
    -- 分区的实例,这里是写了两个主分区
    -- 没有给出子分区的实例,3个子分区是根据哈希函数自动对deptno进行分区(对3进行取模运算)
    partition p1 values less than (2000), -- (-∞,2000)
    partition p2 values less than (3000)  -- [2000,3000)
)

insert into foo_emp select 1,20,2500 from dual;

-- 查看分区p2sp0:主分区p2的p0子分区
select * from foo_emp partition (p2sp0)

-- 查询每个子分区的行数
select subpartition_name,table_rows from information_schema.partitions where table_schema = 'DW' and table_name = 'foo_emp'

2.7.5.2 list-hash(列表哈希)复合分区

sql 复制代码
## list-hash(列表哈希)复合分区

create table  foo_emp1
(
    id int,
    fee int
) 
partition by list(id)  -- 主分区,一级分区
subpartition by hash(fee) -- 子分区,二级分区
(
    partition p1 values in (20)(
    	subpartition p1_p0,		-- 也是3个子分区,不过这是自己定义的
        subpartition p1_p1,		-- 可以指定子分区的名称和个数,但不能指定子分区的值,值是根据选定的字段fee自动划分的
        subpartition p1_p2
    ),
    partition p1 values in (30)(
    	subpartition p2_p0,
        subpartition p2_p1,
        subpartition p2_p2
    )
)

insert into foo_emp1 select 20,200 from dual

select * from foo_emp1 partition(p2_p1)

小结

感谢大家耐心的看完这篇文章,对于SQL在表分区的知识点,我们在MySQL方面已经有三篇内容了,如果大家觉着还算可以,那么就给个三连支持一下吧,如果想要继续关注和学习后续更多的内容,就关注一下爱书不爱输的程序猿吧,当然,如果大家还有什么其他方面的知识点想要看,可以在评论区或者私信我

相关推荐
猿小喵6 分钟前
DBA之路,始于足下
数据库·dba
tyler_download15 分钟前
golang 实现比特币内核:实现基于椭圆曲线的数字签名和验证
开发语言·数据库·golang
李老头探索37 分钟前
Java面试之Java中实现多线程有几种方法
java·开发语言·面试
weixin_4493108441 分钟前
高效集成:聚水潭采购数据同步到MySQL
android·数据库·mysql
CodingBrother42 分钟前
MySQL 和 PostgreSQL 的使用案例
mysql·adb·postgresql
floret*43 分钟前
HiveSQL面试题
hive·sql
RestCloud1 小时前
ETLCloud异常问题分析ai功能
人工智能·ai·数据分析·etl·数据集成工具·数据异常
Dreams°1231 小时前
大数据 ETL + Flume 数据清洗 — 详细教程及实例(附常见问题及解决方案)
大数据·单元测试·可用性测试
sf_www2 小时前
Flink on YARN是如何确定TaskManager个数的
大数据·flink
Cachel wood2 小时前
Github配置ssh key原理及操作步骤
运维·开发语言·数据库·windows·postgresql·ssh·github