MySQL基础（二）

[一. 数据库命令行基本操作指令](#一. 数据库命令行基本操作指令)

[1. 查看当前有哪些数据库------show databases;](#1. 查看当前有哪些数据库——show databases;)

[2. 创建数据库------create database 数据库名 charset utf8](#2. 创建数据库——create database 数据库名 charset utf8)

[3. 选中数据库------use 数据库名;](#3. 选中数据库——use 数据库名;)

[4. 删除数据库------drop database 数据库名;](#4. 删除数据库——drop database 数据库名;)

[二. 常用数据类型](#二. 常用数据类型)

[2.1 数值类型](#2.1 数值类型)

[2.2. 字符串类型](#2.2. 字符串类型)

[2.3 日期类型](#2.3 日期类型)

[三. 数据表的操作](#三. 数据表的操作)

[3.1. 查看数据库中有哪些表 ------ show tables;](#3.1. 查看数据库中有哪些表 —— show tables;)

[3.2. 创建表 ------ create table 表名 (列名类型, 列名类型, ....);](#3.2. 创建表 —— create table 表名 (列名类型, 列名类型, ....);)

[3.3. 查看表的结构（表详情）------ desc 表名;](#3.3. 查看表的结构（表详情）—— desc 表名;)

[4.4. 删除表 ------ drop table 表名;](#4.4. 删除表 —— drop table 表名;)

一. 数据库命令行基本操作指令

tips:

令行中，鼠标选中文本，按下 enter 键是复制，鼠标右键是粘贴。

命令行中的每一条语句都要以 ; 结尾。

指令不区分大小写

1. 查看当前有哪些数据库------show databases;

输入 'show databases; ' 后，就显示出当前的数据库服务器上有哪些数据库（此处的数据库是数据集合）

（会显示至少4个数据库，具体作用在数据库进阶中会介绍）

2. 创建数据库------create database 数据库名 charset utf8

输入'create database 数据库名;' 后，形如下面的提示就表示创建成功

（这里显示的0.00意思是创建数据库消耗的时间不足10ms）

注意事项：

创建数据库的名字，也不能和已有数据库名字重复

创建数据库的时候，数据库的名字，不能和 SQL 中的 "关键字" 重复（像create、show、database、databases......）

不过，也有办法让关键字成为数据库名------创建数据库的时候，给数据库名加上反引号：`

（比如创建一个数据库表示"订单order"，order刚好也是SQL中的关键字）

创建数据库的时候，还需要指定数据库的"字符集charset"，往往是开发中很关键的环节。

首先，了解一下什么是 "字符集"：

一个中文汉字占几个字符？------ 取决于当前的字符集。使用不同的字符集，对应的字节数是不同的。计算机本质上存储二进制数据，就需要约定好不同的数字表示不同的字符。对于英文来说，使用 ASCII码表就足够了；但是对于其他语言文字（比如中文），这个表就无法表示了。因此，需要引入更大的字符表，使用不同的数字，对应到不同的语言文字。

不同的组织，提出不同的编码方案（有不同的表格），因此，同一个汉字在不同编码方案中，对应的数字也是不一样的。但是，存在太多的编码方案会出现兼容问题，随着时间发展，大部分的编码方案都逐渐消亡。
------目前常用的汉字编码方案有两种：

1）GBK 主要是在中国大陆使用（GBK 只能表示简体字，港澳台繁体字无法表示）

Windows 简体中文版，默认编码方式就是 GBK，此时一个汉字使用 2个字节表示；之前使用 VS 编写代码，此时打印的一个汉字也是 2个字节。

2）UTF-8 （也可以写作 UTF8 或 utf8 或者 utf-8）属于变长编码，表示不同的符号，可能用 1-4 个字节来表示。
对于中文汉字来说，一般是 3个字节表示。UTF8 是当前世界上最流行的编码方式，不仅仅能表示中文，也能表示世界上任何一种语言文字。
如果不能正确指定字符集，后续想保存中文，可能会出现问题。比如，mysql 5 默认的字符集是 "拉丁文"，此时如果尝试插入中文数据，就会插入失败；mysql 8 的话默认就是 UTF8。

因此，在创建数据库时，还需要指定数据库的 "字符集" ------ create database 数据库名 charset utf8

但要注意，MySQL 上的 utf8 ，其实不是 "完全体"，有些标准的 utf8字符上可能是不支持的，比如 emoji表情。因此，MySQL 提供了一个方案，utf8mb4 在 MySQL上表示的是完全体utf8。但 utf8mb4 是MySQL创造的，脱离MySQL之外的程序，都不认识这个字符。

在创建数据库的时候，可以指定一个简单的条件 ------ if not exists

（如果不存在，就创建；如果存在，就什么都不做，执行成功，但是会有一个警告。）

如果只是通过命令行，一条一条输入 sql ，此时 if not exists 就没啥用；如果批量执行一组 sql （比如把若干 sql 写到一个文件中），批量执行过程中，任何一个 sql 执行出错，都会使后续 sql 无法继续执行（强制终止了）。

（通过 'show warnings;' 就可以查看警告）

可以在创建数据库的时候，指定 collate 字符约束。 描述了字符串之间的比较规则，比如后续涉及到一些字符串比较规则......（这里暂时不过多讨论，一般使用默认的即可）

3. 选中数据库------use 数据库名;

一个数据库服务器上，有很多的 "数据库"（类似于"文件夹"的感觉）。因此，就需要先选中某个数据库，接下来针对数据表/数据行等操作，就是针对这个被选中的数据库展开的。

4. 删除数据库------drop database 数据库名;

但是，删除数据库是一个非常危险的操作，在未来的工作中，一定要慎重!!! 数据库一旦删除，就恢复不了了！

未来工作中，数据库有很多种。有的数据库是用来测试的（里面的数据是假的，是程序员/测试工程师构造的虚假数据），有的数据库是真正使用的，称为 "线上数据库" / "生产环境数据库"，里面存储的就是真实用户的数据了。误删数据库，会带来极大损失......

------要怎样做才能避免删库呢？

1. 控制权限 ------ 不是每个人都能操作

比如限制普通的开发，只能对数据库进行 "读操作" ，不能修改，尤其是删库这样的操作。即使执行删除语句，也不会真正的删除（报错）。如果确实要删库，要从相关的人员（ DBA，即数据库管理员）进行申请，由人家进行操作。 DBA 一般也只是中大厂才有，小公司比较少（除非专门做数据库业务的）。

2. 要对数据库进行及时备份 ------ 拷贝出来，存储到别的地方

数据备份的一二三原则：一份数据，至少保存到两个机器上，至少有三个副本（拷贝出三份）

但是，具体备份方案，要结合实际情况来定。

3. 让别人帮忙看着

二. 常用数据类型

2.1 数值类型

|--------------|------------|-------------------------------|--------------------------------|
| 数据类型 | 大小 | 说明 | 对应Java类型 |
| BIT $(M)$ | M指定位数，默认为1 | 二进制数，M范围从1到64，存储数值范围从0到2^M-1 | 常用Boolean对应BIT，此时默认是1位，即只能存0和1 |
| TINYINT | 1字节 | | byte |
| SMALLINT | 2字节 | | short |
| INT | 4字节 | | integer |
| BIGINT | 8字节 | | long |
| FLOAT(M,D) | 4字节 | 单精度，M指定长度，D指定小数位数。会发生精度丢失 | float |
| DOUBLE(M,D) | 8字节 | 双精度，M指定长度，D指定小数位数。会发生精度丢失 | double |
| DECIMAL(M,D) | M/D最大值+2 | 双精度，M指定长度，D表示小数点位数。精确数值 | BigDecimal类 |
| NUMERIC(M,D) | M/D最大值+2 | 和DECIMAL一样 | BigDecimal类 |

1） BIT 就可以认为是一组二进制 bit 位， BIT(10) 这个类型里就最多10个bit位。括号中最多写成BIT(64)。
2）虽然 TINYINT 和 SMALLINT 更节省空间，但是还是更推荐使用 INT 和 BIGINT。因为随着时间发展，硬件成本（内存/硬盘）成本是越来越低；相比之下，程序员开发成本（时间）更加尖锐的矛盾。如果因为使用 TINYINT ( -128 ~ +127) / SMALLINT( -32768 ~ +32767) 用处 bug ，这样的 bug 造成的损失，可能远远不是几个硬盘能比的.....
3）浮点数：FLOAT(M,D) 单精度浮点数；DOUBLE(M,D)双精度浮点数。比如定义类型的时候，写作 double(3, 1) ------ 数字长度3位，小数点后1位。后续如果针对数据库进行插入/修改，此时新的数据就要遵循上述规则（10.0、99.5合法，1.00、1、123.0不合法）

MySQL遵守 IEEE754 标准，表示浮点数，类似于科学计数法（二进制）的方式表示小数。很多时候，小数是不能精确存储和表示的，这就导致在进行某些计算的时候，会出现误差；也严禁使用两个浮点数进行比较相等。如果针对浮点数，要比较相等，需要作差，看差值是否小于一定的误差范围（近似相等）。

工程上，很多时候对于误差的容忍度是比较大的；但是有些特殊情况（比如算钱），对于误差非常小。这样的场景使用 float/double 就不合适了..... 因此就引入了更加精确的表示小数方式------DECIMAL(M,D) 和 NUMERIC(M,D)

4） DECIMAL(M,D) 和 NUMERIC(M,D) 这两种类型差别不大，一般使用 decimal 类型即可。这两种类型不再使用 IEEE754 这一套了，而是自己设定了一套存储格式。这个存储格式，相当于 "变长的"，付出更多的空间与时间，使存储的数据更精确。（Java中，提供了类BigDecimal来表示；而 C/C++ 标准库没有提供对应的功能）

IEEE754 这一套标准，虽然有明显的缺陷，仍然成为各种主流语言表示浮点数的方法。主要是因为这一套标准，对于硬件（CPU, 内存）是最友好的，运算速度快，存储空间小。

上述谈到的类型，都是有符号类型（能表示负数）；C语言中，也有一个无符号类型 unsigned 概念，其实在 MySQL 的类型中，也提供了 unsigned 类型。但在 MySQL 官方文档中，明确说明了不建议使用无符号类型，未来更高版本的 MySQL 中可能会被删掉....（Java中就不存在 unsigned 类型）

**无符号类型 --> 弊大于利。**最大的问题 ------ 两个无符号类型做减法的时候，容易出现溢出，从而得到很大的整数。

2.2. 字符串类型

|---------------|--------------|-------------|--------------|
| 数据类型 | 大小 | 说明 | 对应Java类型 |
| VARCHAR(SIZE) | 0-65,535字节 | 可变长度字符串 | String |
| TEXT | 0-65,535字节 | 长文本数据 | String |
| MEDIUMTEXT | 0-16777215字节 | 中等长度文本数据 | String |
| BLOB | 0-65,535字节 | 二进制形式的长文本数据 | String |

1）varchar(size) --> 可变长的字符串 （如果是定长字符串，设定小不够用，设定大浪费空间，可变长就能很好的解决上述问题）。范围是 0~65535 （64kb）

varchar(50): 表示最大为 50 个字符。
2） TEXT 也是可变长的字符串，不需要指定最大长度，完全根据你存储的数据自适应。虽然 TEXT 和 varchar 都是可变长的，但实际更倾向于使用 varchar。(因为 varchar 可以指定最大长度，程序员很容易预估出表里面的数据量有多少；而 TEXT 没法指定，大小难以预估，可能会很大)
**3）blob 存储的是二进制数据，前面的都是存储文本数据。**一般视频、音频、图片、可执行文件.....都是使用二进制数据存储。

计算机存储和表示数据都是二进制的方式。所谓的 "文本" 是一种特殊的情况，即文本数据里面的二进制内容，都可以在对应的码表上查询到对应的合法的字符。反之，"二进制" 内容无法在码表上查询到，或者查到的都是一些 "乱码" 之类的字符。

如果数据库存储的是形如 "hello" 这样的字符串，使用 varchar / text 等类型；如果存储图片/视频/音频，使用 blob。但blob 只能表示最大 64kb，因此一般不建议使用数据库直接存储图片/视频/音频。

2.3 日期类型

|-----------|--------|------------------------------|-----------------------------------|
| 数据类型 | 大小 | 说明 | 对应Java类型 |
| DATETIME | 8字节 | 范围从1000到9999年，不会进行时区的检索及转换。 | java.util.Date、java.sql.Timestamp |
| TIMESTAMP | 4字节 | 范围从1970到2038年，自动检索当前时区并进行转换。 | java.util.Date、java.sql.Timestamp |

三. 数据表的操作

对于数据表的操作 ，都要先 use 选中数据库，才能操作。

3.1. 查看数据库中有哪些表 ------ show tables;

数据库中进行一些查询操作，就会得到一系列结果数据，就把这些结果称为 "结果集"。

（set 此处表示集合）

3.2. 创建表 ------ create table 表名 (列名类型, 列名类型, ....);

在关系型数据库中，一个表有哪些列，每个列叫啥名字，是啥类型，都要提前确定好，后续往表里存储的数据，都要严格遵守上述类型要求。

（表示列的时候，列名在前，类型在后）

可以使用 comment 增加字段说明（注释），只能在建表语句中使用，用来描述每个列是什么意思。

也可以使用 -- / # 增加注释（更推荐使用 --）

3.3. 查看表的结构（表详情）------ desc 表名;

"desc 表名; " 用来查看表的结构（有哪些列，每个列是什么情况，类似于 "文件详情" 内容），不能查看表里的内容 。这样的内容也称为 "元数据"（Meta Data）

（表的特征 --> 列信息）

Field字段，即属性。
varchar(20) 意思是最大长度是20个字符
int(11) 意思是整数 "位宽" 11（int 在硬盘上存储仍然是4个字节，但是在控制台上显示的时候，最多显示11个字符这么宽） int 表示的范围：-21亿 ~ +21亿
Null列：yes意为可以不填写 (填表格有 "必填项" 和 "选填项")
Default列：默认值

4.4. 删除表 ------ drop table 表名;

"drop table if exists 表名" 类似于 "create database if not exists 数据库名"

删表是指删除数据库中的一个表，但保留数据库其它部分的操作。删表操作会影响到特定表的数据和结构，但不会影响到数据库中的其他表。

注意：删表操作往往会比删库的危险更大。 为什么呢？

------对于删库操作，一般都是第一时间就能发现问题，程序在操作数据库时，第一时间反馈出问题（监控报警系统...），处理的越及时，损失就越小；对于删表操作，就更隐藏了。比如一个数据库有100个表，不小心删了其中一个，程序使用数据库的时候，绝大部分的逻辑都是正常的，在使用99个表的过程中，虽然数据库能访问，但是逻辑已经出问题了。不知道要过多久，才能触发一次访问到第 100 个表这样的操作，才会触发一次报错...... 指不定又过了多久，这样的报错积累到一定程度，才触发报警.....