介绍
目前的难题
- IO瓶颈:热点数据太多,数据库缓存不足,产生大量磁盘IO,效率较低。请求数据太多,带宽不够,网络IO瓶颈
- cpu瓶颈:排序、分组、连接查询、聚合统计等sql会耗费大量的cpu资源,请求数太多,cpu出现瓶颈。
分库分表的中心思想就是将数据分散存储,使得单一数据库/表的数据量变小来缓解单一数据库的性能问题,从而达到提升数据库性能的目的
拆分策略
垂直拆分:垂直分库、垂直分表
水平拆分:水平分库、水平分表
分库:将一个数据库中数据分散存储在多个数据库中
分表:将一张表的数据分散存储在多个表中
垂直分库:以表为依据,根据业务将不同表拆分到不同库中
每个库的表结构都不一样、每个库的数据也不一样、所有库的并集是全量数据
垂直分表:以字段为依据,根据字段属性将不同字段拆分到不同表中。
每个表的结构都不一样;每个表的数据也不一样,一般通过一列(主键、外键)关联;所有表的并集是全量数据。
水平分库:以字段为依据,按照一定策略,将一个库的数据拆分到多个库中。
每个库的表结构都一样;每个库的数据都不一样;所有库的并集是全量数据
水平分表:以字段为依据,按照一定策略,将一个表的数据拆分到多个表中
每个库的表结构都一样;每个库的数据都不一样;所有库的并集是全量数据
问题:这么多数据库,我后端访问那个数据库呢
shardingJDBC:基于AOP原理,在应用程序中对本地执行的SQL进行拦截,解析、改写、路由处理。需要自行编码配置实现,只支持java语言,性能较高。
Mycat:数据库分库分表中间件,不用调整代码即可实现分库分表,支持多种语言,性能不及前者。
Mycat概述
数据库中间件,可以像使用mysql一样来使用Mycat,对于开发人员来说根本感觉不到Mycat的存在
性能可靠稳定;强大的技术团队;体系完善;社区活跃
目录结构
bin:存放可执行文件,用于启动停止mycat
conf:存放mycat的配置文件
lib:存放mycat的项目依赖包(jar)
logs:存放mycat的日志文件
Mycat入门
配置schema.xml
xml
<?xml version="1.0"?>
<!DOCTYPE mycat:schema SYSTEM "schema.dtd">
<mycat:schema xmlns:mycat="http://io.mycat/">
<schema name="DB01" checkSQLschema="true" sqlMaxLimit="100" randomDataNode="dn1">
<table name="TB_ORDER" dataNode="dn1,dn2,dn3" rule="auto-sharding-long" splitTableNames ="true"/>
</schema>
<dataNode name="dn1" dataHost="dhost1" database="db01" />
<dataNode name="dn2" dataHost="dhost2" database="db02" />
<dataNode name="dn3" dataHost="dhost3" database="db03" />
<dataHost name="dhost1" maxCon="1000" minCon="10" balance="0"
writeType="0" dbType="mysql" dbDriver="jdbc" switchType="1" slaveThreshold="100">
<heartbeat>select user()</heartbeat>
<writeHost host="master" url="jdbc:mysql://192.168.160.143:3306?useSSL=false&serverTimezone=Asia/shanghai&characterEncoding=utf8" user="root"
password="1234">
</writeHost>
</dataHost>
<dataHost name="dhost2" maxCon="1000" minCon="10" balance="0"
writeType="0" dbType="mysql" dbDriver="jdbc" switchType="1" slaveThreshold="100">
<heartbeat>select user()</heartbeat>
<writeHost host="master" url="jdbc:mysql://192.168.160.144:3306?useSSL=false&serverTimezone=Asia/shanghai&characterEncoding=utf8" user="root"
password="1234">
</writeHost>
</dataHost>
<dataHost name="dhost3" maxCon="1000" minCon="10" balance="0"
writeType="0" dbType="mysql" dbDriver="jdbc" switchType="1" slaveThreshold="100">
<heartbeat>select user()</heartbeat>
<writeHost host="master" url="jdbc:mysql://192.168.160.142:3306?useSSL=false&serverTimezone=Asia/shanghai&characterEncoding=utf8" user="root"
password="1234">
</writeHost>
</dataHost>
</mycat:schema>
配置server.xml
xml
<user name="root" defaultAccount="true">
<property name="password">123456</property>
<property name="schemas">DB01</property>
<!--No MyCAT Database selected 错误前会尝试使用该schema作为schema,不设置则为null,报错 -->
<!-- 表级 DML 权限设置 -->
<!--
<privileges check="false">
<schema name="TESTDB" dml="0110" >
<table name="tb01" dml="0000"></table>
<table name="tb02" dml="1111"></table>
</schema>
</privileges>
-->
</user>
<user name="user">
<property name="password">user</property>
<property name="schemas">DB01</property>
<property name="readOnly">true</property>
</user>
启动服务
切换到mycat的安装目录,执行如下指令:
bash
#启动
bin/mycat start
#停止
bin/mycat stop
是够启动成功
shell
cd /usr/local/mycat/
tail -f logs/wrapper.log
分片测试
shell
mysql -h127.0.0.1 -P8066 -uroot -p123456
Mycat配置
schema.xml
schema.xml作为mycat中最重要的配置文件之一,涵盖了mycat的逻辑库,逻辑表,分片规则,分片节点及数据源的配置。
主要包含三组标签
-
schema标签
用于定义mycat实例中的逻辑库,一个mycat实例中,可以有多个逻辑库,可以通过schema标签来划分不同的逻辑库。mycat中的逻辑库的概念,等同于MySQL中的batabase概念,需要操作某个逻辑库下的表时,也需要切换逻辑库(use xxx)。
核心属性:
- name:指定自定义的逻辑库库名(区分大小写)
- checkSQLschema:在SQL语句操作时指定了数据库名称,执行时是否自动去除;true:自动去除,false:自动不去除
- sqlMaxLimit:如果未指定limit进行查询,列表查询模式查询多少条记录。
- table:定义了mycat中逻辑库schema下的逻辑表,所有需要拆分的表都需要在table标签中定义
- dataNode:定义逻辑表所属的dataNode,该属性需要与dataNode标签中name对应;多个dataNode逗号分隔
- rule:分片规则名字,分片规则名字是在rule.xml中定义
- primaryKey:逻辑表对应真实表主键
- type:逻辑表的类型,目前逻辑表只有全局表和普通表,如果未配置,就是普通表;全局表,配置为global
-
datanode标签
定义mycat中的数据节点,也就是我们常说的数据分片。一个dataNode标签就是一个独立的数据节点
核心属性
- name:定义数据节点名称
- dataHost:数据库实例主机名称,引用自dataHost标签中的name属性
- database:定义分片所属数据库
-
datahost标签
mycat逻辑库中作为底层标签存在,直接定义了具体的数据库实例、读写分离、心跳语句。
核心属性
- name:唯一标识,供上层标签使用
- maxcon/mincon:最大连接数/最连接数
- balance:负载均衡策略,取值0,1,2,3
- writeType:写操作分发方式(0:写操作转发到第一个writeHost,第一个挂了,切换到第二个;1:写操作随机分发到配置的writeHost)
- dbDriver:数据库驱动,支持native、jdbc
rule.xml
定义所有拆分表的规则,在使用过程中可以灵活的使用分片算法,或者对同一分片算法使用不同参数,它让分片过程可配置化、主要包含两类标签:tableRule、Function。
server.xml
mycat系统配置信息,主要有两个重要标签system、user。
Mycat分片
垂直拆分
全局表配置:数据字典表,在多个业务模块中都有可能遇到,可以设置为全局表
分片规则(数值):
- 范围分片:根据指定的字段及其配置的范围与数据节点的对应情况,来决定数据属于哪一个分片(auto-sharding-long)
- 取模分片:根据指定的字段值与节点数量进行求模运算,根据运算结果,来决定该数据属于哪一个分片(mod-long)
分片规则(字符):
- 一致性hash分片:相同的hash因子计算值总是被划分到相同的分区表中,不会因为分区节点的增加而改变原来数据的分区位置。(sharding-by-murmur)
分片规则(枚举)
- 枚举分片:通过在配置文件中配置可能的枚举值,指定数据分布到不同数据节点上,本规则适用于按照省份、性别、状态拆分数据等业务。(sharding-by-intfile),可能有多个枚举分片,一次自定义是最合理的(修改sharding-by-intfile)
分片规则(应用指定)
- 运行阶段由应用自主决定路由到那个分片,直接根据字符子串(必须是数字)计算分片号(sharding-by-substring)
分片规则(固定分片hash算法)
- 该算法类似十进制求模运算,但是为二进制的操作,例如,取id的二进制低10位于111111111进行位&运算(sharding-by-long-hash)
分片规则(字符串hash解析)
- 截取字符串中的指定位置的子字符串,进行hash算法,算出分片(sharding-by-stringhash)
分片规则(按天(日期)分片)
- sharding-by-date
分片规则(自然月)
- 按照月份分片,每个自然月为一个分片(sharding-by-month)
Mycat管理及监控
mycat默认开通2个端口,可以在server.xml中进行修改
- 8066数据访问端口,即进行DML和DDL操作
- 9066数据库管理端口,即mycat服务管理控制功能,用于管理mycat的整个集群状态
mycat-eye
是对mycat-server提供监控服务,功能不局限于对mycat-server使用。他通过JDBC连接对mycat、mysql监控,监控远程服务器(目前仅限于linux系统)的cpu、内存、网络、磁盘
mycat-eye运行过程中需要依赖zookeeper,因此需要先安装zookeeper。