如何学编程之理论篇.03.如何做数据库表结构设计？

（01）.吃透设计文档

如何依据软件开发的概要设计书和详细设计书，系统性地完成数据库表结构设计，这是软件开发中非常核心且关键的一环，既要贴合业务需求，也要保证数据存储的合理性和性能。

一、设计前的准备：吃透设计文档

首先要从概要设计书和详细设计书中提取核心信息，这是设计的基础：

从概要设计书提取 ：
- 系统的核心业务域（如电商系统的用户、商品、订单、支付等）；
- 业务实体及实体间的核心关系（如用户和订单是一对多，商品和订单是多对多）；
- 系统的核心功能模块（明确哪些模块需要存储数据）；
- 非功能性需求（如数据量预估、并发量、响应时间要求，影响表结构的性能设计）。
从详细设计书提取 ：
- 每个业务实体的具体属性（如用户实体包含用户名、手机号、密码、注册时间等）；
- 属性的业务规则（如手机号是否唯一、密码是否加密、注册时间是否必填）；
- 业务流程中的数据流转（如订单从创建到支付、发货、完成的状态变化，需设计状态字段）；
- 数据的读写规则（如哪些字段高频查询、哪些字段只写不读，影响索引设计）。

二、数据库表结构设计的核心步骤

步骤 1：梳理实体与属性，初步列出字段

基于设计文档中的业务实体，拆解每个实体的属性，形成「实体 - 属性」清单，示例如下（以电商用户为例）：

实体	属性	业务规则
用户	用户名	非空、唯一、长度≤32
用户	手机号	非空、唯一、符合手机号格式
用户	密码	非空、加密存储
用户	注册时间	非空、默认当前时间
用户	状态	非空、枚举（正常 / 禁用 / 注销）

步骤 2：定义字段属性（数据类型、约束）

结合业务规则，为每个字段确定核心属性，遵循「最小够用」原则（避免过度设计）：

数据类型 ：优先选择匹配业务的最小类型（如手机号用varchar(11)而非varchar(255)，年龄用tinyint而非int）；
约束：
- 主键（PK）：每个表必须有主键（优先自增 ID 或雪花 ID，避免业务字段做主键）；
- 非空（NOT NULL）：必填字段设置，避免空值引发查询异常；
- 唯一（UNIQUE）：唯一标识的字段（如手机号、用户名）；
- 外键（FK）：关联其他表的字段（如订单表的user_id关联用户表的id，可选，也可通过业务逻辑保证关联）；
- 默认值（DEFAULT）：如注册时间默认CURRENT_TIMESTAMP，状态默认「正常」。

步骤 3：处理实体间关系，设计关联表 / 关联字段

根据设计文档中实体的关系，设计对应的表结构：

一对一（1:1）：如用户和用户详情，可合并为一张表（字段少），或分表（字段多），用主键关联；
一对多（1:N） ：如用户和订单，在「多」的一方（订单表）增加「一」的一方的主键（user_id）作为外键；
多对多（M:N） ：如商品和订单，需设计中间关联表（如order_goods），包含两个实体的主键（order_id、goods_id），可增加扩展字段（如购买数量、单价）。

步骤 4：优化表结构（性能、维护性）

结合设计文档的非功能性需求优化：

分表 / 分库 ：若预估数据量极大（如订单表亿级数据），提前规划分表规则（如按时间分表order_202401、order_202402）；
索引设计 ：高频查询的字段（如订单表的user_id、order_status）建立索引，避免全表扫描；
- 注意：索引不宜过多（影响插入 / 更新性能），避免对大字段（如text）建索引；
冗余字段：高频查询的关联字段可适当冗余（如订单表冗余「用户名」，避免每次查询都关联用户表）；
状态字段标准化：用数字枚举表示状态（如订单状态：0 - 待支付、1 - 已支付、2 - 已发货），而非字符串，节省存储空间且查询更快。

步骤 5：编写表结构文档，落地执行

生成建表 SQL：基于设计结果编写标准化的建表语句，示例（MySQL）：

sql 复制代码

-- 用户表
CREATE TABLE `user` (
  `id` bigint unsigned NOT NULL AUTO_INCREMENT COMMENT '用户主键ID',
  `username` varchar(32) NOT NULL COMMENT '用户名',
  `mobile` varchar(11) NOT NULL COMMENT '手机号',
  `password` varchar(64) NOT NULL COMMENT '加密后的密码',
  `register_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '注册时间',
  `status` tinyint NOT NULL DEFAULT 1 COMMENT '状态：1-正常，0-禁用，2-注销',
  PRIMARY KEY (`id`),
  UNIQUE KEY `uk_mobile` (`mobile`),
  UNIQUE KEY `uk_username` (`username`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='用户基础信息表';

-- 订单表
CREATE TABLE `order` (
  `id` bigint unsigned NOT NULL AUTO_INCREMENT COMMENT '订单主键ID',
  `order_no` varchar(32) NOT NULL COMMENT '订单编号',
  `user_id` bigint unsigned NOT NULL COMMENT '关联用户ID',
  `total_amount` decimal(10,2) NOT NULL COMMENT '订单总金额',
  `status` tinyint NOT NULL DEFAULT 0 COMMENT '订单状态：0-待支付，1-已支付，2-已发货，3-已完成',
  `create_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '创建时间',
  PRIMARY KEY (`id`),
  UNIQUE KEY `uk_order_no` (`order_no`),
  KEY `idx_user_id` (`user_id`),
  KEY `idx_status` (`status`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='订单表';

编写表结构设计文档：包含表说明、字段说明、索引说明、关联关系、业务规则，便于开发和维护；
评审与落地：组织开发、测试、产品评审，确认符合设计文档要求后，执行建表 SQL。

三、关键注意事项

贴合设计文档，不偏离业务：所有表结构设计必须溯源到概要 / 详细设计书，若发现文档模糊或矛盾，需及时和产品 / 设计人员确认，避免主观臆断；
预留扩展字段 ：可增加ext1、ext2（varchar类型）或ext_json（json类型），应对后期少量的业务扩展，避免频繁改表；
考虑数据迁移 / 兼容：若系统是迭代开发，需考虑历史表结构的兼容，避免影响现有功能。

总结

设计前核心是吃透概要 / 详细设计书，提取业务实体、属性、关系和非功能性需求，这是设计的根本；
设计中遵循「先拆解实体属性，再处理关联，最后优化性能」的步骤，保证表结构贴合业务且性能可控；
设计后需编写标准化的建表 SQL 和文档，并通过评审落地，确保符合设计文档要求。

(02).如何根据业务规则确定字段的数据类型？

如何结合具体的业务规则来精准确定数据库表字段的数据类型，这是数据库设计中避免「大材小用」或「类型不匹配」的核心环节，直接影响数据存储的效率、准确性和业务适配性。

一、核心原则：先明确业务规则，再匹配数据类型

确定字段类型的核心逻辑是：业务规则决定字段的「取值范围、格式要求、使用场景」，再基于这三点匹配最合适的数据类型，而非凭经验随意选择。

二、按业务规则分类确定数据类型

下面按常见的字段类型（数值、字符串、时间、特殊类型），结合具体业务规则给出匹配方案，每个类别都附业务场景 + 规则 + 选型示例，新手可直接参考：

1. 数值类字段（存储数字）

业务规则核心关注：数值范围、是否有小数、是否为金额 / 计数 / 编码

业务规则场景	推荐数据类型	原因 & 示例
年龄（0-200）、状态码（0-9）	tinyint $unsigned$	范围小（-128~127/0~255），占用 1 字节，比 int 节省空间；如订单状态（0 - 待支付、1 - 已支付）
数量（0-10 万）、排序值	smallint $unsigned$	范围适中（-32768~32767/0~65535），占用 2 字节；如商品库存（0-10 万）
用户 ID、订单 ID（百万级）	int $unsigned$	范围大（-21 亿～21 亿 / 0~42 亿），占用 4 字节；常规系统足够用
超大 ID （千万 / 亿级）、雪花 ID	bigint $unsigned$	范围极大（0~1844 亿亿），占用 8 字节；如分布式系统的全局唯一 ID
金额（保留 2 位小数）	decimal(M,D)	精确无精度丢失，如 decimal (10,2)（总位数 10，小数 2 位，可存 0~99999999.99）；⚠️ 避免用 float/double（浮点精度丢失，如 0.1+0.2≠0.3）
百分比（保留 1 位小数）	decimal(5,1)	如 decimal (5,1) 可存 - 999.9~999.9，适配折扣（9.5 折）、增长率（12.3%）

2. 字符串类字段（存储文本 / 编码）

业务规则核心关注：长度是否固定、是否有格式规则、是否需检索 / 索引

业务规则场景	推荐数据类型	原因 & 示例
手机号（11 位）、身份证号（18 位）	char (长度)	长度固定，查询效率高；如 char (11) 存手机号，char (18) 存身份证号
用户名（≤32 位）、地址（≤200 位）	varchar (长度)	长度可变，节省空间；如 varchar (32) 存用户名，varchar (200) 存收货地址
超长文本（备注、富文本）	text/longtext	长度无上限（text 最大 65535 字符，longtext 最大 4GB）；如订单备注、商品详情
JSON 格式数据（扩展字段）	json	支持结构化存储，可直接检索 JSON 内字段；如 ext_json 存用户扩展信息（{"hobby":"跑步","city":"北京"}）
加密字符串（密码、token）	varchar(64/128)	加密后长度固定（如 MD5 加密后 32 位，BCrypt 加密后 60 位），选 varchar (64) 足够

3. 时间 / 日期类字段

业务规则核心关注：是否需精确到时分秒、是否记录时间戳、是否跨时区

业务规则场景	推荐数据类型	原因 & 示例
注册时间、订单创建时间（需时分秒）	datetime	格式为 YYYY-MM-DD HH:MM:SS，范围 1000~9999 年，无需时区转换；如 create_time
记录时间戳（需计算时间差）	timestamp	存储 Unix 时间戳（1970~2038 年），占用 4 字节，自动转换时区；如更新时间 update_time
仅需日期（生日、下单日期）	date	格式为 YYYY-MM-DD，占用 3 字节；如 birthday（生日）、order_date（下单日期）
仅需时间（打卡时间）	time	格式为 HH:MM:SS，如 check_in_time（上班打卡时间 09:00:00）

4. 特殊类型字段

业务规则场景	推荐数据类型	原因 & 示例
存储文件 / 图片（二进制）	blob/ longblob	存储二进制数据；但实际业务中不推荐（数据库压力大），建议存文件 URL，文件放 OSS
布尔值（是否删除、是否启用）	tinyint(1)	数据库无专门 bool 类型，用 tinyint (1) 替代（0 = 否，1 = 是）；如 is_delete（0 - 未删，1 - 已删）

三、避坑指南：按业务规则规避常见错误

避免「一刀切」用 varchar (255)：比如手机号用 varchar (255)，既浪费空间，又无法约束长度（可能存 10 位 / 12 位错误手机号）；按业务规则，手机号固定 11 位，应选 char (11)，并可加校验规则。
金额禁用浮点型：业务规则要求金额精确，float/double 会有精度丢失（如 100.01 元存成 100.0099999999），必须用 decimal (M,D)。
时间字段避免用字符串：若把创建时间存为 varchar (20)（如 "2024-01-01 12:00"），无法直接做时间范围查询（如 where create_time > '2024-01-01'），也无法计算时间差，应选 datetime/timestamp。
超长文本禁用 varchar：若商品详情有几千字，用 varchar (2000) 会浪费空间且查询慢，应选 text 类型。

四、实操示例：结合业务规则设计字段

以「电商订单表」的核心字段为例，完整展示业务规则→数据类型的推导过程：

字段名	业务规则	数据类型	推导说明
id	订单 ID，需支持亿级数据	bigint unsigned	亿级数据超过 int 范围，选 bigint unsigned
order_no	订单编号，固定 32 位字符串，唯一	char(32)	长度固定，char 查询效率高，加唯一索引
user_id	关联用户 ID，百万级用户	int unsigned	百万级用户 int 足够，unsigned 避免负数
total_amount	订单总金额，保留 2 位小数，最大 999999.99 元	decimal(8,2)	精确存储金额，8 位总长度（6 位整数 + 2 位小数）
status	订单状态，0 - 待支付 / 1 - 已支付 / 2 - 已发货	tinyint	状态值范围小，tinyint 节省空间
create_time	创建时间，需精确到时分秒，无需时区转换	datetime	符合业务时间展示和查询需求
remark	订单备注，用户输入，长度不确定（≤1000 字）	varchar(1000)	长度可变，1000 字足够覆盖备注场景

总结

确定字段数据类型的核心是先拆解业务规则（取值范围、格式、使用场景），再匹配「最小够用」的类型；
数值类优先按范围选 tinyint/smallint/int/bigint，金额必须用 decimal；字符串类按长度是否固定选 char/varchar，超长文本用 text；
规避「varchar (255) 万能论」「金额用浮点型」「时间存字符串」等常见错误，确保数据类型贴合业务且高效。

(03).如何建立表与表的关联关系？

如何在数据库表结构设计中，正确建立表与表之间的关联关系，这是保证数据完整性、贴合业务逻辑的关键，核心是根据业务规则识别实体间的关系类型，再用对应的数据库设计方式落地。

一、先明确表关联的核心前提

在建立关联前，必须先确定两个核心：

识别实体间的关系类型：从详细设计书 / 业务规则中明确表（实体）是「一对一」「一对多」还是「多对多」关系；
确定主键（PK） ：每个表必须有唯一标识的主键（如id），关联关系本质是通过主键 + 外键（或关联字段） 建立的。

二、不同关联关系的建立方法（附实操示例）

以下以 MySQL 为例，结合电商场景（用户、订单、商品）讲解，所有示例均贴合真实业务规则。

1. 一对一（1:1）关系

业务特征：一个表的一条记录仅对应另一个表的一条记录（如用户表 ↔ 用户详情表）。

设计原则：优先合并为一张表（字段少）；若字段过多（如用户基础信息 + 用户收货地址 / 偏好），拆分后用「主键关联」或「唯一外键关联」。

实操示例：

场景：用户基础表（user）存储核心信息，用户详情表（user_detail）存储扩展信息，一一对应。

设计方式：

sql 复制代码

-- 1. 用户基础表（主表）
CREATE TABLE `user` (
  `id` bigint unsigned NOT NULL AUTO_INCREMENT COMMENT '用户主键ID',
  `mobile` varchar(11) NOT NULL COMMENT '手机号',
  `username` varchar(32) NOT NULL COMMENT '用户名',
  `status` tinyint NOT NULL DEFAULT 1 COMMENT '状态：1-正常，0-禁用',
  PRIMARY KEY (`id`),
  UNIQUE KEY `uk_mobile` (`mobile`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='用户基础表';

-- 2. 用户详情表（从表）：用主键关联，或新增user_id作为唯一外键
CREATE TABLE `user_detail` (
  `id` bigint unsigned NOT NULL AUTO_INCREMENT COMMENT '详情ID',
  `user_id` bigint unsigned NOT NULL COMMENT '关联用户ID（一对一）',
  `avatar` varchar(255) DEFAULT '' COMMENT '头像URL',
  `birthday` date DEFAULT NULL COMMENT '生日',
  `address` varchar(500) DEFAULT '' COMMENT '常用地址',
  PRIMARY KEY (`id`),
  -- 核心：唯一外键约束，保证一对一
  UNIQUE KEY `uk_user_id` (`user_id`),
  -- 外键约束（可选，也可通过业务逻辑保证）
  CONSTRAINT `fk_user_detail_user_id` FOREIGN KEY (`user_id`) 
        REFERENCES `user` (`id`) ON DELETE CASCADE ON UPDATE CASCADE
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='用户详情表';

关键说明：
- user_detail的user_id加UNIQUE约束，确保一个用户仅对应一条详情；
- 外键约束ON DELETE CASCADE表示删除用户时自动删除详情，ON UPDATE CASCADE表示用户 ID 更新时同步更新（根据业务选择是否开启）；
- 若业务简单，可直接将user_detail的字段合并到user表，减少关联查询成本。

2. 一对多（1:N）关系

业务特征：一个表的一条记录对应另一个表的多条记录（如用户表 → 订单表：一个用户可下多个订单）。

设计原则 ：在「多」的一方（从表）增加「一」的一方（主表）的主键作为关联字段（外键）。

实操示例：

场景：用户（1）→ 订单（N），一个用户有多个订单，一个订单仅属于一个用户。

设计方式：

sql 复制代码

-- 1. 订单表（从表）：新增user_id关联用户表主键
CREATE TABLE `order` (
  `id` bigint unsigned NOT NULL AUTO_INCREMENT COMMENT '订单ID',
  `order_no` varchar(32) NOT NULL COMMENT '订单编号',
  `user_id` bigint unsigned NOT NULL COMMENT '关联用户ID（外键）',
  `total_amount` decimal(10,2) NOT NULL COMMENT '订单总金额',
  `status` tinyint NOT NULL DEFAULT 0 COMMENT '订单状态：0-待支付，1-已支付',
  `create_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '创建时间',
  PRIMARY KEY (`id`),
  UNIQUE KEY `uk_order_no` (`order_no`),
  -- 索引：高频查询user_id，建立索引提升性能
  KEY `idx_user_id` (`user_id`),
  -- 外键约束（可选）
  CONSTRAINT `fk_order_user_id` FOREIGN KEY (`user_id`) 
        REFERENCES `user` (`id`) ON DELETE RESTRICT ON UPDATE CASCADE
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='订单表';

关键说明：
- 「多」的一方（订单表）新增user_id，关联「一」的一方（用户表）的主键id；
- 外键约束ON DELETE RESTRICT表示禁止删除有订单的用户（避免数据孤立），符合业务规则；
- 对user_id建立索引，因为高频查询「某用户的所有订单」（WHERE user_id = ?），索引可避免全表扫描。

3. 多对多（M:N）关系

业务特征：一个表的一条记录对应另一个表的多条记录，反之亦然（如订单表 ↔ 商品表：一个订单包含多个商品，一个商品可出现在多个订单中）。

设计原则：新增「中间关联表」，包含两个主表的主键作为联合关联字段，可新增扩展字段（如购买数量、单价）。

实操示例：

场景：订单（M）↔ 商品（N），需通过order_goods中间表建立关联。

设计方式：

sql 复制代码

-- 1. 商品表（主表1）
CREATE TABLE `goods` (
  `id` bigint unsigned NOT NULL AUTO_INCREMENT COMMENT '商品ID',
  `goods_name` varchar(100) NOT NULL COMMENT '商品名称',
  `price` decimal(10,2) NOT NULL COMMENT '商品单价',
  `stock` int unsigned NOT NULL DEFAULT 0 COMMENT '库存',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='商品表';

-- 2. 订单-商品关联表（中间表）
CREATE TABLE `order_goods` (
  `id` bigint unsigned NOT NULL AUTO_INCREMENT COMMENT '关联ID',
  `order_id` bigint unsigned NOT NULL COMMENT '关联订单ID',
  `goods_id` bigint unsigned NOT NULL COMMENT '关联商品ID',
  `buy_num` int unsigned NOT NULL DEFAULT 1 COMMENT '购买数量',
  `buy_price` decimal(10,2) NOT NULL COMMENT '购买时的单价（快照，避免商品价格变动）',
  PRIMARY KEY (`id`),
  -- 联合唯一索引：避免同一订单重复关联同一商品
  UNIQUE KEY `uk_order_goods` (`order_id`,`goods_id`),
  -- 单独索引：提升查询性能
  KEY `idx_order_id` (`order_id`),
  KEY `idx_goods_id` (`goods_id`),
  -- 外键约束
  CONSTRAINT `fk_order_goods_order_id` FOREIGN KEY (`order_id`) REFERENCES `order` (`id`) ON DELETE CASCADE,
  CONSTRAINT `fk_order_goods_goods_id` FOREIGN KEY (`goods_id`) REFERENCES `goods` (`id`) ON DELETE RESTRICT
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='订单-商品关联表';

关键说明：
- 中间表order_goods核心字段是order_id（关联订单表）和goods_id（关联商品表）；
- 增加buy_num（购买数量）、buy_price（购买单价）等扩展字段，贴合业务（商品价格可能变动，需记录下单时的价格）；
- 加UNIQUE KEY (order_id, goods_id)，避免同一订单中重复添加同一商品；
- 外键约束ON DELETE CASCADE表示删除订单时自动删除关联记录，ON DELETE RESTRICT表示禁止删除有订单关联的商品。

三、关联关系的进阶注意事项

外键约束的取舍 ：
- 中小型系统：建议使用外键，保证数据完整性（如禁止删除有订单的用户）；
- 高并发 / 分布式系统：通常不建外键（外键会增加数据库开销），改为业务逻辑层保证关联完整性（如删除用户前先检查是否有未完成订单）。
关联查询的性能优化 ：
- 对关联字段（如user_id、order_id）建立索引，避免关联查询时全表扫描；
- 多对多关联查询尽量控制层级（如避免 3 张以上表联查），可通过冗余字段减少关联（如订单表冗余商品名称）。
避免循环关联 ：
- 禁止 A 表关联 B 表、B 表关联 C 表、C 表又关联 A 表，会导致查询死循环和数据维护困难。

四、关联关系验证方法

建立关联后，需验证是否符合业务规则：

插入测试数据 ：
- 一对一：尝试给同一个用户插入两条详情记录，应触发唯一约束报错；
- 一对多：给一个用户插入多条订单记录，应成功；
- 多对多：给一个订单插入多个商品，给一个商品关联多个订单，应成功。
关联查询测试 ：
- 查「某用户的所有订单」：SELECT * FROM order WHERE user_id = 1;
- 查「某订单的所有商品」：SELECT g.*, og.buy_num FROM goods g JOIN order_goods og ON g.id = og.goods_id WHERE og.order_id = 1;

总结

建立表关联的核心是先识别关系类型（1:1/1:N/M:N），再按对应规则设计：1:1 用唯一外键、1:N 用从表关联字段、M:N 用中间表；
关联的本质是通过「主键 + 关联字段（外键）」连接，外键可选，需根据系统规模决定是否使用；
多对多关联必须新增中间表，且建议增加联合唯一索引和扩展字段，贴合业务需求。

(04).如何在数据库表结构设计中保证数据的完整性和一致性？

在数据库表结构设计阶段，通过哪些具体手段来保障数据的完整性（数据符合业务规则、无无效 / 错误数据）和一致性（关联数据同步、无矛盾），这是数据库设计的核心目标之一，既要从表结构层面做约束，也要结合设计规范和业务逻辑来落地。

一、先明确核心概念

数据完整性：确保存储的数据是「合法、有效、符合业务规则」的，比如手机号必须是 11 位、订单金额不能为负、用户 ID 不能为空；
数据一致性：确保关联数据是「同步、无矛盾」的，比如删除用户时其订单要么同步删除，要么禁止删除，避免出现「孤立订单」；修改用户 ID 时，其所有订单的 user_id 需同步更新。

二、保障数据完整性的核心手段

1. 字段级约束：从源头杜绝无效数据

这是最基础的一层，通过字段的属性约束，直接限制字段的取值范围和格式，避免脏数据入库。

约束类型	适用场景	实操示例（MySQL）	作用说明
NOT NULL	必填字段（如手机号、订单编号）	`mobile varchar(11) NOT NULL`	禁止字段为空，避免核心信息缺失
DEFAULT	有默认值的字段（如状态、创建时间）	`status tinyint NOT NULL DEFAULT 1`	未显式赋值时自动填充默认值，保证字段有合法值
UNIQUE	唯一标识字段（如手机号、订单编号）	`UNIQUE KEY uk_mobile (mobile)`	禁止重复值，避免同一手机号注册多个账号
CHECK（MySQL8.0+）	取值范围约束（如金额≥0、年龄≤200）	`CHECK (total_amount >= 0)`	强制字段值符合业务规则（如订单金额不能为负）
枚举（ENUM）	固定取值的字段（如订单状态）	`status ENUM('0','1','2') NOT NULL`	仅允许输入指定值，避免无效状态（如订单状态出现「99」这种未定义值）
数据类型匹配	所有字段	金额用 decimal、时间用 datetime	避免用错误类型存储数据（如金额用 float 导致精度丢失、时间用字符串无法校验）

实操示例：用户表字段级约束

sql 复制代码

CREATE TABLE `user` (
  `id` bigint unsigned NOT NULL AUTO_INCREMENT COMMENT '用户ID',
  `mobile` varchar(11) NOT NULL COMMENT '手机号',
  `username` varchar(32) NOT NULL DEFAULT '' COMMENT '用户名',
  `age` tinyint unsigned DEFAULT NULL COMMENT '年龄',
  `status` tinyint NOT NULL DEFAULT 1 COMMENT '状态：1-正常，0-禁用',
  `register_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '注册时间',
  PRIMARY KEY (`id`),
  UNIQUE KEY `uk_mobile` (`mobile`),
  -- CHECK约束：年龄范围0-200
  CHECK (`age` IS NULL OR `age` BETWEEN 0 AND 200)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;

2. 表级约束：保证单表内数据逻辑合法

针对单表内多个字段的关联规则，或主键的唯一性约束：

主键约束（PRIMARY KEY）：每个表必须有主键，保证每条记录唯一标识（避免重复记录）；优先用自增 ID / 雪花 ID，避免业务字段（如手机号）做主键（业务字段可能变更）；

复合唯一约束 ：针对「组合字段唯一」的场景（如用户 + 商品的收藏关系，一个用户不能重复收藏同一商品）：

sql 复制代码

-- 收藏表：用户ID+商品ID组合唯一
CREATE TABLE `user_collect` (
  `id` bigint unsigned NOT NULL AUTO_INCREMENT,
  `user_id` bigint unsigned NOT NULL,
  `goods_id` bigint unsigned NOT NULL,
  PRIMARY KEY (`id`),
  -- 复合唯一约束
  UNIQUE KEY `uk_user_goods` (`user_id`,`goods_id`)
) ENGINE=InnoDB;

3. 业务规则约束：通过设计规避逻辑错误

字段 / 表级约束无法覆盖所有业务规则，需在设计阶段提前规避：

状态字段标准化：用数字枚举定义状态（如订单状态：0 - 待支付、1 - 已支付、2 - 已发货），并在设计文档中明确状态流转规则（如待支付→已支付→已发货，禁止反向流转）；
数据快照存储：对易变动的关联数据做快照（如订单表存储下单时的商品价格，而非实时关联商品表价格），避免商品价格变动导致订单金额不一致；
避免 NULL 值歧义 ：对非必填字段，用「空字符串」「0」等明确值替代 NULL（如用户地址未填写则存 ''，而非 NULL），避免 NULL 在查询时的歧义（NULL != NULL）。

三、保障数据一致性的核心手段

数据一致性主要针对多表关联场景，核心是保证关联数据的同步和无矛盾。

1. 外键约束：数据库层面强制关联一致性

外键约束是数据库原生的一致性保障手段，通过关联主表主键，限制从表的取值和操作：

sql 复制代码

-- 订单表关联用户表：外键约束
CREATE TABLE `order` (
  `id` bigint unsigned NOT NULL AUTO_INCREMENT,
  `order_no` varchar(32) NOT NULL,
  `user_id` bigint unsigned NOT NULL,
  PRIMARY KEY (`id`),
  -- 外键约束：user_id关联user表的id
  CONSTRAINT `fk_order_user_id` FOREIGN KEY (`user_id`) 
  REFERENCES `user` (`id`) 
  ON DELETE RESTRICT  -- 禁止删除有订单的用户（避免孤立订单）
  ON UPDATE CASCADE   -- 用户ID更新时，订单的user_id同步更新
) ENGINE=InnoDB;

外键操作规则选择 ：

规则	作用	适用场景
RESTRICT	禁止操作（如删除主表记录时，若从表有关联则报错）	核心业务（如禁止删除有订单的用户）
CASCADE	级联操作（如删除主表记录时，同步删除从表关联记录）	附属数据（如删除订单时同步删除订单商品关联记录）
SET NULL	从表关联字段设为 NULL（需字段允许 NULL）	非核心关联（如删除分类时，商品的分类 ID 设为 NULL）
NO ACTION	同 RESTRICT（MySQL 中等效）	兼容其他数据库

2. 取消外键时的一致性保障（高并发场景）

高并发 / 分布式系统中，外键会增加数据库开销，通常不使用外键，需通过业务逻辑层保证一致性：

操作前校验：删除用户前，先查询是否有未完成订单，有则提示「无法删除」；

事务控制 ：关联操作放入事务，保证原子性（要么全成功，要么全失败）：

sql 复制代码

-- 示例：创建订单+扣减库存，放入事务保证一致性
START TRANSACTION;
-- 1. 创建订单
INSERT INTO `order` (order_no, user_id, total_amount) VALUES ('20240211001', 1, 99.9);
-- 2. 扣减商品库存（需先校验库存充足）
UPDATE `goods` SET stock = stock - 1 WHERE id = 1 AND stock >= 1;
-- 3. 提交事务（若步骤2失败，则回滚）
COMMIT;

分布式事务：跨库关联操作时，用 Seata、RocketMQ 事务消息等保证最终一致性。

3. 时间戳 / 版本号：保证数据更新一致性

针对「并发更新」场景（如多人同时修改同一订单状态），避免数据覆盖：

乐观锁 ：新增version版本号字段，更新时校验版本号，确保只有最新版本能更新：

sql 复制代码

-- 订单表新增version字段
ALTER TABLE `order` ADD `version` int NOT NULL DEFAULT 1 COMMENT '版本号';

-- 更新订单状态：仅当版本号匹配时才更新，更新后版本号+1
UPDATE `order` 
SET status = 1, version = version + 1 
WHERE id = 1 AND version = 1;

时间戳 ：新增update_time字段，更新时校验最后更新时间，避免覆盖最新数据。

四、设计层面的通用规范（兜底保障）

统一命名规范 ：表名、字段名统一（如所有主键用id，关联字段用「主表名_主键名」如user_id），避免因命名混乱导致关联错误；
数据字典：编写完整的数据字典，明确每个字段的含义、取值范围、业务规则，所有开发 / 测试人员遵循同一标准；
定期校验：设计定时任务，校验数据一致性（如查询「user_id 不在 user 表的订单」「库存为负的商品」），发现问题及时修复；
备份与回滚：设计数据备份策略，误操作时可回滚，避免数据一致性被破坏后无法恢复。

五、常见问题与避坑指南

过度依赖外键：外键会降低写入性能，且分布式系统中跨库外键无法生效，需结合系统规模选择是否使用；
忽略并发更新：多人同时修改同一数据时，未加乐观锁导致数据覆盖（如两个请求同时扣减库存，导致库存为负）；
状态流转无约束：未明确状态流转规则（如订单已完成后又被改为待支付），导致数据逻辑矛盾；
NULL 值处理不当 ：用 NULL 存储非必填字段，查询时因NULL无法参与等值比较（WHERE address = NULL无结果），需用IS NULL，增加业务逻辑复杂度。

总结

数据完整性靠「字段级约束（NOT NULL/UNIQUE/CHECK）+ 表级约束（主键 / 复合唯一）+ 业务规则设计」三层保障，从源头杜绝无效数据；
数据一致性在中小型系统靠「外键约束」，高并发 / 分布式系统靠「事务 + 业务逻辑校验 + 乐观锁」，核心是保证关联数据同步无矛盾；
设计规范（命名、数据字典、定期校验）是兜底手段，能减少因人为失误导致的数据完整性 / 一致性问题。

(05).如何在数据库表结构设计中保证数据的可扩展性？

在数据库表结构设计阶段，通过哪些具体策略来保证数据的可扩展性 ------ 也就是当业务需求变更、数据量增长、功能迭代时，表结构能以最小的成本适配变化，避免大规模重构或性能瓶颈，这是设计中兼顾「当下可用」和「未来兼容」的关键。

一、先明确数据可扩展性的核心目标

数据可扩展性主要解决三类问题：

业务扩展：新增字段 / 业务规则时，无需大规模修改现有表结构；
数据量扩展：数据量从万级增长到亿级时，表结构能适配分库分表、性能优化；
功能扩展：新增功能（如多维度查询、多租户）时，表结构无需推倒重来。

二、保证数据可扩展性的核心设计策略（附实操示例）

1. 字段设计：预留扩展空间，避免频繁改表

频繁 ALTER TABLE（如新增字段、修改类型）会锁表（MySQL InnoDB），影响线上服务，需从字段层面提前规避：

（1）新增「通用扩展字段」

对非核心业务字段，预留通用扩展字段，应对临时的小需求变更，无需新增字段：

sql 复制代码

CREATE TABLE `user` (
  `id` bigint unsigned NOT NULL AUTO_INCREMENT COMMENT '用户ID',
  `mobile` varchar(11) NOT NULL COMMENT '手机号',
  -- 核心字段
  `status` tinyint NOT NULL DEFAULT 1 COMMENT '状态：1-正常，0-禁用',
  -- 通用扩展字段：应对小范围业务扩展
  `ext1` varchar(255) DEFAULT '' COMMENT '扩展字段1（如邀请码）',
  `ext2` varchar(255) DEFAULT '' COMMENT '扩展字段2（如推荐人ID）',
  `ext_json` json DEFAULT NULL COMMENT '结构化扩展字段（如用户偏好：{"hobby":"跑步","city":"北京"}）',
  PRIMARY KEY (`id`),
  UNIQUE KEY `uk_mobile` (`mobile`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;

关键说明：
- ext1/ext2：用于存储简单的字符串型扩展数据（如临时加的邀请码、来源渠道）；
- ext_json：MySQL 5.7 + 支持 json 类型，可存储结构化扩展数据，支持直接检索（如WHERE ext_json->'$.city' = '北京'），比多个 ext 字段更灵活；
- 扩展字段仅用于「低频、非核心」的业务扩展，核心字段仍需单独设计（保证查询性能）。

（2）字段类型「兼容未来」，避免过小

选择字段类型时，预留合理的取值范围，避免因业务增长导致类型不足：

业务场景	避免的类型	推荐类型	原因
用户 ID / 订单 ID	int	bigint unsigned	int 最大存储 42 亿，亿级业务易超限；bigint 可存储 1844 亿亿，足够支撑超大规模
用户名 / 商品名称	varchar(16)	varchar(32/64)	避免业务调整后名称长度超限（如用户名从 16 位扩展到 20 位）
金额	decimal(8,2)	decimal(10,2)	预留更大的金额范围（如从 999999.99 扩展到 99999999.99）

（3）避免使用「过度专用」的类型

禁用enum类型：新增枚举值需 ALTER TABLE（如订单状态新增「退款中」），改为tinyint+ 数据字典（用数字表示状态，字典记录含义）；
慎用set类型：扩展值需改表，且查询逻辑复杂，改为关联表存储（如用户标签用user_tag关联表，而非 set 类型）。

2. 表结构设计：拆分与抽象，适配业务扩展

（1）按「业务域」拆分表，避免大表

将一个包含数百字段的「大表」拆分为多个「小表」，按业务域隔离，扩展时仅修改对应子表：

反例：用户表包含基础信息、收货地址、会员信息、积分信息等所有字段，扩展会员等级时需改全表；
正例：拆分为user（基础信息）、user_address（收货地址）、user_member（会员信息）、user_points（积分信息），扩展会员等级仅修改user_member表。

（2）按「读写特征」拆分表（冷热分离）

将高频读写的「热数据」和低频读写的「冷数据」拆分，避免冷数据影响热数据性能，也便于冷数据单独扩展：

sql 复制代码

-- 订单热表：存储近6个月的订单（高频查询/修改）
CREATE TABLE `order_hot` (
  `id` bigint unsigned NOT NULL AUTO_INCREMENT,
  `order_no` varchar(32) NOT NULL,
  `user_id` bigint unsigned NOT NULL,
  `status` tinyint NOT NULL DEFAULT 0,
  `total_amount` decimal(10,2) NOT NULL,
  `create_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP,
  PRIMARY KEY (`id`),
  KEY `idx_user_id` (`user_id`),
  KEY `idx_status` (`status`)
) ENGINE=InnoDB;

-- 订单冷表：存储6个月前的订单（仅查询，无修改）
CREATE TABLE `order_cold` (
  `id` bigint unsigned NOT NULL,
  `order_no` varchar(32) NOT NULL,
  `user_id` bigint unsigned NOT NULL,
  -- 同热表字段，新增归档时间
  `archive_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP,
  PRIMARY KEY (`id`),
  KEY `idx_user_id` (`user_id`)
) ENGINE=InnoDB;

关键说明：冷表可单独做分表 / 归档，甚至迁移到低成本存储（如归档数据库），热表保持高性能。

（3）预留分库分表字段，适配数据量扩展

提前设计分库分表的「分片键」，避免后期数据量激增时重构表结构：

示例：订单表按「用户 ID」分库，按「创建时间」分表，需在表中保留这两个字段作为分片依据：

sql 复制代码

CREATE TABLE `order` (
  `id` bigint unsigned NOT NULL AUTO_INCREMENT,
  `order_no` varchar(32) NOT NULL,
  `user_id` bigint unsigned NOT NULL COMMENT '分片键1：分库依据',
  `create_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '分片键2：分表依据（按年月分表）',
  `status` tinyint NOT NULL DEFAULT 0,
  PRIMARY KEY (`id`),
  KEY `idx_user_id` (`user_id`),
  KEY `idx_create_time` (`create_time`)
) ENGINE=InnoDB;

关键：分片键需选择「查询高频、分布均匀」的字段（如 user_id、order_no），避免数据倾斜。

3. 关联设计：松耦合，适配功能扩展

（1）弱化外键依赖，用「业务外键」替代

外键会强绑定表关系，扩展时（如分库）无法跨库关联，改为「业务外键」（仅逻辑关联，无数据库外键约束）：

示例：订单表的user_id仅存储用户 ID，不建外键约束，通过业务逻辑保证关联完整性（如创建订单前校验 user_id 存在）；
优势：分库时订单表和用户表可分布在不同库，仍能通过 user_id 关联查询，适配分布式扩展。

（2）多对多关联表预留扩展字段

中间关联表除了存储两个主表的 ID，预留扩展字段，应对业务扩展：

sql 复制代码

CREATE TABLE `order_goods` (
  `id` bigint unsigned NOT NULL AUTO_INCREMENT,
  `order_id` bigint unsigned NOT NULL,
  `goods_id` bigint unsigned NOT NULL,
  `buy_num` int unsigned NOT NULL DEFAULT 1,
  `buy_price` decimal(10,2) NOT NULL,
  -- 扩展字段：应对业务新增需求
  `gift_flag` tinyint NOT NULL DEFAULT 0 COMMENT '是否赠品：0-否，1-是',
  `discount_amount` decimal(10,2) NOT NULL DEFAULT 0 COMMENT '优惠金额',
  PRIMARY KEY (`id`),
  UNIQUE KEY `uk_order_goods` (`order_id`,`goods_id`)
) ENGINE=InnoDB;

说明：后期新增「赠品」「优惠金额」等需求时，无需新增表，直接复用扩展字段即可。

4. 设计规范：标准化，降低扩展成本

（1）统一的命名与字段规范

表名：用「业务域_功能」（如user_member、order_goods），避免模糊命名（如t1、data）；
字段名：核心字段统一（如主键用id，关联字段用「主表名_id」，创建时间用create_time，更新时间用update_time）；
优势：新增表 / 扩展字段时，开发人员无需重新学习命名规则，降低沟通和修改成本。

（2）完整的数据字典

为每个表、字段编写数据字典，明确：

字段含义、数据类型、取值范围；
业务规则（如status的枚举值含义）；
扩展说明（如ext_json可存储的结构化数据）；
作用：后期扩展时，开发人员可快速理解字段用途，避免错误修改或新增重复字段。

（3）版本化设计（适用于核心表）

对核心表（如商品表、订单表）做版本化，避免修改现有字段影响旧功能：

sql 复制代码

-- 商品基础表（v1）
CREATE TABLE `goods_v1` (
  `id` bigint unsigned NOT NULL AUTO_INCREMENT,
  `goods_name` varchar(64) NOT NULL,
  `price` decimal(10,2) NOT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB;

-- 商品扩展表（v2）：新增功能时，不修改v1，新增v2关联
CREATE TABLE `goods_v2` (
  `id` bigint unsigned NOT NULL AUTO_INCREMENT,
  `goods_id` bigint unsigned NOT NULL,
  `category_id` bigint unsigned NOT NULL COMMENT '新增分类字段',
  `spec_json` json DEFAULT NULL COMMENT '新增规格字段',
  PRIMARY KEY (`id`),
  UNIQUE KEY `uk_goods_id` (`goods_id`)
) ENGINE=InnoDB;

优势：旧功能继续使用goods_v1，新功能使用goods_v1 + goods_v2关联查询，避免修改旧表导致兼容性问题。

三、扩展时的落地原则（避免踩坑）

增量扩展，而非全量重构 ：新增字段 / 表时，保留原有结构，通过「新增」而非「修改」适配需求（如新增user_member表，而非修改user表增加会员字段）；
性能与扩展平衡：扩展字段（如 ext_json）虽灵活，但查询性能低于单独字段，核心查询字段仍需单独设计，仅非核心字段用扩展字段；
提前评估扩展成本：新增表 / 字段前，评估对现有查询、索引、分库分表的影响，避免扩展后出现性能瓶颈；
灰度扩展：先在测试环境验证扩展后的表结构，再灰度上线（如先扩展部分用户的订单表，验证无问题后全量推广）。

总结

字段层面：预留ext扩展字段、选择兼容未来的类型、禁用过度专用类型，避免频繁改表；
表结构层面：按业务域 / 读写特征拆分表、预留分库分表字段，适配数据量和业务扩展；
关联层面：弱化外键、在中间表预留扩展字段，降低表间耦合；
规范层面：统一命名、编写数据字典、版本化设计，降低扩展的沟通和改造成本。

核心思路是「预留空间、松耦合、标准化」，让表结构在应对业务变化时，既能快速适配，又不破坏现有功能和性能。

(05).如何在数据库表结构设计中保证数据的高效性？

在数据库表结构设计阶段，通过哪些具体策略来保证数据的高效性 ------ 也就是让数据的存储更节省空间、查询 / 写入 / 更新操作更快，同时能适配数据量增长后的性能需求，这是数据库设计中兼顾「功能」和「性能」的核心目标。

一、先明确数据高效性的核心维度

数据高效性主要体现在三个方面：

存储高效：用最少的存储空间存储数据，减少磁盘 IO 和内存占用；
查询高效：高频查询能快速命中结果，避免全表扫描；
写入 / 更新高效：新增、修改数据时耗时短，不产生大量锁等待或性能瓶颈。

二、保证数据高效性的核心设计策略（附实操示例）

1. 字段设计：从源头降低存储和 IO 开销

字段是表结构的最小单元，合理的字段设计是高效性的基础：

（1）选择「最小够用」的数据类型

优先选择匹配业务规则的最小数据类型，减少单条记录的存储空间，提升 IO 效率（磁盘 / 内存一次能加载更多记录）：

表格

业务场景	低效选择	高效选择	存储节省	性能提升点
年龄（0-200）	int	tinyint unsigned	3 字节	单字段存储从 4 字节降为 1 字节，内存缓存更多数据
订单状态（0-9）	smallint	tinyint	1 字节	索引占用空间更小，查询更快
手机号（11 位）	varchar(255)	char(11)	244 字节	固定长度，查询时无需计算长度，效率更高
金额（0-999999.99）	decimal(18,2)	decimal(8,2)	-	字段长度更短，索引和计算效率更高
布尔值（是否删除）	varchar(10)	tinyint(1)	9 字节	存储和索引效率远高于字符串

实操示例：用户表字段优化

sql 复制代码

-- 低效设计
CREATE TABLE `user_bad` (
  `id` int NOT NULL AUTO_INCREMENT,          -- 亿级数据会超限
  `mobile` varchar(255) NOT NULL,           -- 浪费空间
  `age` int DEFAULT NULL,                   -- 年龄用int过大
  `is_delete` varchar(5) DEFAULT 'false',   -- 布尔值用字符串
  PRIMARY KEY (`id`)
) ENGINE=InnoDB;

-- 高效设计
CREATE TABLE `user_good` (
  `id` bigint unsigned NOT NULL AUTO_INCREMENT, -- 适配亿级数据
  `mobile` char(11) NOT NULL,                  -- 固定长度，节省空间
  `age` tinyint unsigned DEFAULT NULL,         -- 最小够用
  `is_delete` tinyint(1) DEFAULT 0,            -- 布尔值用tinyint
  PRIMARY KEY (`id`),
  UNIQUE KEY `uk_mobile` (`mobile`)            -- 唯一索引优化
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;

（2）避免使用低效的字段类型 / 设计

禁用TEXT/BLOB存储高频查询字段：这类字段占用大量空间，且无法建高效索引，如需存储（如商品详情），单独拆分表存储，核心表仅存 URL/ID；
避免用字符串存储时间 / 数值：如用varchar(20)存时间（"2024-01-01"），无法直接做范围查询，且排序 / 索引效率低，改用datetime/timestamp；
减少 NULL 值使用：NULL 值会增加存储开销（需额外标记），且查询时NULL != NULL导致逻辑复杂，非必填字段用空字符串（''）、0 等替代；
慎用 JSON 类型：JSON 字段灵活但查询 / 索引效率低于普通字段，仅用于非高频查询的扩展数据（如用户偏好）。

2. 索引设计：精准建立索引，提升查询效率

索引是查询高效的核心，但过多 / 不当索引会降低写入效率，需「按需建立、精准优化」：

（1）核心索引设计原则

索引类型	适用场景	示例	避坑点
主键索引（PK）	唯一标识记录	`PRIMARY KEY (id)`	避免用业务字段（如手机号）做主键（易变更）
唯一索引（UK）	唯一约束的字段（如手机号、订单号）	`UNIQUE KEY uk_mobile (mobile)`	避免对高写入字段建唯一索引（如频繁更新的昵称）
普通索引（KEY）	高频查询条件（如 user_id、status）	`KEY idx_user_id (user_id)`	避免对低基数字段建索引（如性别：仅 0/1）
复合索引	多字段组合查询（如 user_id+status）	`KEY idx_user_status (user_id, status)`	遵循「最左前缀原则」，如索引 (a,b) 仅适配 a、a+b 查询

（2）复合索引的「最左前缀」实操

sql 复制代码

-- 订单表：高频查询场景是「某用户的某状态订单」
CREATE TABLE `order` (
  `id` bigint unsigned NOT NULL AUTO_INCREMENT,
  `order_no` varchar(32) NOT NULL,
  `user_id` bigint unsigned NOT NULL,
  `status` tinyint NOT NULL DEFAULT 0,
  `create_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP,
  PRIMARY KEY (`id`),
  UNIQUE KEY `uk_order_no` (`order_no`),
  -- 复合索引：适配 WHERE user_id = ? AND status = ?
  KEY `idx_user_status` (`user_id`, `status`),
  -- 单独索引：适配 WHERE create_time BETWEEN ? AND ?
  KEY `idx_create_time` (`create_time`)
) ENGINE=InnoDB;

-- 有效查询（命中复合索引）
SELECT * FROM `order` WHERE user_id = 1;          -- 最左前缀：仅用user_id
SELECT * FROM `order` WHERE user_id = 1 AND status = 0; -- 全匹配
-- 无效查询（未命中复合索引）
SELECT * FROM `order` WHERE status = 0;           -- 跳过最左前缀user_id

（3）索引优化的核心避坑点

避免「索引失效」：查询条件中对索引字段做函数 / 运算（如WHERE DATE(create_time) = '2024-01-01'），会导致索引失效，改为WHERE create_time BETWEEN '2024-01-01 00:00:00' AND '2024-01-01 23:59:59'；
控制索引数量：单表索引不超过 5 个，写入高频表（如订单表）索引更少，避免新增 / 更新时频繁维护索引；
定期清理无效索引：删除未被使用、重复的索引（如同时有idx_user_id和idx_user_status，前者可删除）。

3. 表结构设计：拆分与优化，适配数据量增长

（1）拆分大表：按业务 / 数据特征拆分

垂直拆分 ：将字段多的大表拆分为多个小表，分离「高频字段」和「低频字段」，减少 IO 开销：

sql 复制代码

-- 拆分前：商品表包含高频字段（名称、价格）和低频字段（详情、规格）
-- 拆分后：
CREATE TABLE `goods_core` ( -- 高频查询表：仅存核心字段
  `id` bigint unsigned NOT NULL AUTO_INCREMENT,
  `goods_name` varchar(64) NOT NULL,
  `price` decimal(10,2) NOT NULL,
  `stock` int unsigned NOT NULL DEFAULT 0,
  PRIMARY KEY (`id`),
  KEY `idx_name` (`goods_name`)
) ENGINE=InnoDB;

CREATE TABLE `goods_ext` ( -- 低频查询表：存扩展字段
  `id` bigint unsigned NOT NULL AUTO_INCREMENT,
  `goods_id` bigint unsigned NOT NULL,
  `detail` text DEFAULT NULL,
  `spec_json` json DEFAULT NULL,
  PRIMARY KEY (`id`),
  UNIQUE KEY `uk_goods_id` (`goods_id`)
) ENGINE=InnoDB;

水平拆分 ：数据量超大时（如订单表亿级），按分片键分表（如按时间分order_202401、order_202402，按用户 ID 哈希分order_00-order_99），单表数据量控制在百万级，提升查询 / 写入效率。

（2）冷热数据分离

将高频读写的「热数据」（如近 3 个月订单）和低频读写的「冷数据」（如 3 个月前订单）拆分到不同表 / 库：

热表：保留完整索引，适配高频查询；
冷表：仅保留必要索引，甚至迁移到低成本存储（如归档库），降低核心库压力。

（3）合理冗余字段，减少关联查询

关联查询（尤其是多表联查）是性能瓶颈的主要原因，对高频查询的关联字段做适度冗余：

sql 复制代码

-- 订单表：冗余用户名称，避免每次查询都关联用户表
CREATE TABLE `order` (
  `id` bigint unsigned NOT NULL AUTO_INCREMENT,
  `order_no` varchar(32) NOT NULL,
  `user_id` bigint unsigned NOT NULL,
  `user_name` varchar(32) NOT NULL COMMENT '冗余字段：用户名称',
  `total_amount` decimal(10,2) NOT NULL,
  PRIMARY KEY (`id`),
  KEY `idx_user_id` (`user_id`)
) ENGINE=InnoDB;

注意：冗余字段仅用于高频查询，且需保证同步更新（如用户改名时，同步更新订单表的user_name）。

4. 写入 / 更新优化：减少锁冲突，提升操作效率

（1）选择合适的存储引擎（MySQL）

优先选择InnoDB（支持事务、行级锁），避免MyISAM（表级锁，高并发写入时锁表）：

sql 复制代码

CREATE TABLE `order` (
  -- 字段定义
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4; -- 明确指定InnoDB

（2）优化主键设计

优先用「自增 ID」做主键：InnoDB 主键是聚簇索引，自增 ID 写入时顺序存储，无页分裂，写入效率高；
避免用 UUID/GUID 做主键：无序的 UUID 会导致聚簇索引页分裂，严重降低写入效率。

（3）批量操作替代单条操作

高并发写入时（如批量创建订单），用批量 INSERT/UPDATE 替代单条操作，减少网络 IO 和事务开销：

sql 复制代码

-- 低效：单条插入
INSERT INTO `order` (order_no, user_id) VALUES ('20240211001', 1);
INSERT INTO `order` (order_no, user_id) VALUES ('20240211002', 2);

-- 高效：批量插入
INSERT INTO `order` (order_no, user_id) 
VALUES ('20240211001', 1), ('20240211002', 2);

（4）避免长事务

长事务会占用锁资源，导致其他操作等待，设计时控制事务范围（仅包含必要操作）：

sql 复制代码

-- 低效：长事务包含非必要查询
START TRANSACTION;
SELECT * FROM `user` WHERE id = 1; -- 非必要查询
INSERT INTO `order` (order_no, user_id) VALUES ('20240211001', 1);
UPDATE `goods` SET stock = stock - 1 WHERE id = 1;
COMMIT;

-- 高效：事务仅包含核心写入/更新
START TRANSACTION;
INSERT INTO `order` (order_no, user_id) VALUES ('20240211001', 1);
UPDATE `goods` SET stock = stock - 1 WHERE id = 1;
COMMIT;

三、高效性验证与持续优化

执行计划分析 ：用EXPLAIN分析查询语句，确认是否命中索引、是否全表扫描：
sql 复制代码
```
EXPLAIN SELECT * FROM `order` WHERE user_id = 1 AND status = 0;
```
- 关键看type列（优先ref/range，避免ALL）、key列（显示命中的索引）；
监控性能指标：关注慢查询日志、磁盘 IO、CPU 使用率，定位低效操作；
定期优化：根据业务增长和数据量变化，调整索引、拆分表结构，避免性能随数据量下降。

总结

字段层面：选择「最小够用」的数据类型，避免低效类型（如字符串存时间），减少 NULL 值，从源头降低存储和 IO 开销；
索引层面：按需建立索引，优先复合索引并遵循「最左前缀原则」，控制索引数量，避免索引失效；
表结构层面：拆分大表、冷热分离、适度冗余字段，适配数据量增长，减少关联查询；
写入 / 更新层面：用 InnoDB 引擎、自增主键、批量操作，避免长事务，减少锁冲突。

核心思路是「以业务场景为导向，在存储、查询、写入间找平衡」------ 既保证查询高效，又不牺牲写入性能，同时适配数据量的增长。

(06).如何优化数据库表结构以提高写入和更新数据的效率？

具体该如何优化数据库表结构，来针对性提升数据写入（INSERT）和更新（UPDATE）的效率，这是高并发业务场景中非常关键的优化方向，核心思路是减少数据库在写入 / 更新时的资源开销、锁冲突和 IO 操作，同时兼顾表结构的合理性。

一、核心优化原则

写入 / 更新效率低的核心原因通常是：索引维护开销大、锁竞争激烈、数据写入碎片化、字段 / 表设计冗余。优化的核心是「降低写入时的计算 / IO 成本」「减少锁等待」「避免不必要的资源消耗」。

二、表结构层面的核心优化策略（附实操示例）

1. 精简索引：减少写入时的索引维护开销

索引是查询的加速器，但却是写入 / 更新的「负担」------ 每一次 INSERT/UPDATE 都会同步维护所有相关索引（如 B + 树的插入 / 调整），索引越多，开销越大。

（1）只保留「必要索引」，删除无效 / 冗余索引

删除规则 ：
1. 移除未被使用的索引（可通过慢查询日志、数据库监控工具识别）；
2. 移除冗余索引（如已有复合索引idx_user_status (user_id, status)，则单独的idx_user_id可删除）；
3. 避免对「高频更新字段」建索引（如用户的积分、订单的状态）。

实操示例 ：

sql 复制代码

-- 优化前：订单表索引过多，写入慢
CREATE TABLE `order_bad` (
  `id` bigint unsigned NOT NULL AUTO_INCREMENT,
  `order_no` varchar(32) NOT NULL,
  `user_id` bigint unsigned NOT NULL,
  `status` tinyint NOT NULL DEFAULT 0,
  `create_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP,
  PRIMARY KEY (`id`),
  UNIQUE KEY `uk_order_no` (`order_no`), -- 必要：订单号唯一
  KEY `idx_user_id` (`user_id`),         -- 冗余：被复合索引覆盖
  KEY `idx_status` (`status`),           -- 低价值：状态基数低，查询效率差
  KEY `idx_user_status` (`user_id`, `status`) -- 核心：高频查询组合
) ENGINE=InnoDB;

-- 优化后：仅保留必要索引
CREATE TABLE `order_good` (
  `id` bigint unsigned NOT NULL AUTO_INCREMENT,
  `order_no` varchar(32) NOT NULL,
  `user_id` bigint unsigned NOT NULL,
  `status` tinyint NOT NULL DEFAULT 0,
  `create_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP,
  PRIMARY KEY (`id`),
  UNIQUE KEY `uk_order_no` (`order_no`), -- 保留：唯一约束
  KEY `idx_user_status` (`user_id`, `status`) -- 保留：核心查询
) ENGINE=InnoDB;

（2）慎用唯一索引（UK），用业务逻辑替代

唯一索引的维护成本高于普通索引（需额外校验唯一性），若业务允许「最终一致」，可将唯一校验移到业务层：

反例：对「用户昵称」建唯一索引（昵称频繁修改，每次更新都要校验唯一性）；
正例：业务层先查询昵称是否存在，再执行更新，仅对「非高频更新的唯一字段（如手机号、订单号）」建唯一索引。

2. 优化字段设计：降低写入时的存储 / 计算开销

（1）选择「最小且高效」的数据类型

优先用定长类型（char/tinyint/int）而非变长类型（varchar/text），定长数据写入时无需计算长度，磁盘存储更连续；

避免用大字段（text/blob/json）存储核心表，如需存储则拆分到单独表（如商品详情拆到goods_ext表），核心表仅存 ID/URL：

sql 复制代码

-- 核心表：仅存高频写入/查询的小字段
CREATE TABLE `goods_core` (
  `id` bigint unsigned NOT NULL AUTO_INCREMENT,
  `goods_name` varchar(64) NOT NULL,
  `price` decimal(10,2) NOT NULL,
  `stock` int unsigned NOT NULL DEFAULT 0,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB;

-- 扩展表：存储大字段，写入频率低
CREATE TABLE `goods_ext` (
  `id` bigint unsigned NOT NULL AUTO_INCREMENT,
  `goods_id` bigint unsigned NOT NULL,
  `detail` text DEFAULT NULL, -- 大字段
  PRIMARY KEY (`id`),
  UNIQUE KEY `uk_goods_id` (`goods_id`)
) ENGINE=InnoDB;

（2）减少 NULL 值，降低存储开销

NULL 值需要额外的存储空间标记，且写入时需处理 NULL 逻辑，非必填字段用「空字符串 / 0」替代：

sql 复制代码

-- 优化前：多个NULL字段
CREATE TABLE `user_bad` (
  `id` bigint unsigned NOT NULL AUTO_INCREMENT,
  `mobile` char(11) NOT NULL,
  `avatar` varchar(255) DEFAULT NULL, -- NULL值
  `address` varchar(500) DEFAULT NULL, -- NULL值
  PRIMARY KEY (`id`)
) ENGINE=InnoDB;

-- 优化后：用空字符串替代NULL
CREATE TABLE `user_good` (
  `id` bigint unsigned NOT NULL AUTO_INCREMENT,
  `mobile` char(11) NOT NULL,
  `avatar` varchar(255) DEFAULT '', -- 空字符串
  `address` varchar(500) DEFAULT '', -- 空字符串
  PRIMARY KEY (`id`)
) ENGINE=InnoDB;

3. 优化主键与存储引擎：减少写入碎片化

（1）优先用「自增主键」（InnoDB）

InnoDB 的主键是聚簇索引，数据按主键顺序存储：

自增主键：写入时数据追加到磁盘末尾，无「页分裂」，写入效率极高；
非自增主键（如 UUID / 手机号）：写入时需插入到磁盘中间位置，导致页分裂，碎片增多，写入变慢。

sql 复制代码

-- 推荐：自增主键
CREATE TABLE `order` (
  `id` bigint unsigned NOT NULL AUTO_INCREMENT, -- 自增主键
  `order_no` varchar(32) NOT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB;

-- 避免：UUID做主键
CREATE TABLE `order_bad` (
  `id` varchar(36) NOT NULL, -- UUID
  `order_no` varchar(32) NOT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB;

（2）强制使用 InnoDB 引擎，开启合适的配置

禁用 MyISAM：MyISAM 是表级锁，高并发写入时会锁整张表，InnoDB 是行级锁，冲突更小；
开启innodb_autoinc_lock_mode = 2（MySQL 5.1+）：自增主键的锁模式优化，提升批量插入效率；

配置示例（my.cnf）：

Lua 复制代码

[mysqld]
default-storage-engine = InnoDB
innodb_autoinc_lock_mode = 2
innodb_flush_log_at_trx_commit = 2 -- 折中方案：每秒刷日志，提升写入效率（牺牲少量数据安全性）

4. 拆分大表 / 冷热分离：降低单表写入压力

（1）水平分表：分散写入压力

当单表数据量超过 1000 万时，写入 / 更新效率会显著下降，需按「分片键」水平分表：

按时间分表：如订单表拆分为order_202401、order_202402，每月写入新表，单表数据量可控；
按哈希分表：如用户表按user_id % 100拆分为user_00-user_99，分散写入压力。

（2）冷热数据分离：减少核心表写入量

将「高频写入的热数据」和「几乎不更新的冷数据」拆分：

热表：如order_hot（近 3 个月订单），保留必要索引，适配高频写入 / 更新；
冷表：如order_cold（3 个月前订单），仅保留主键索引，禁止更新，降低资源占用。

5. 优化更新逻辑：减少锁冲突和冗余操作

（1）精准更新，避免全字段更新

更新时仅修改「需要变更的字段」，而非全字段更新，减少数据传输和索引维护开销：

sql 复制代码

-- 低效：全字段更新（即使仅status变更）
UPDATE `order` SET order_no = '20240211001', user_id = 1, status = 1 WHERE id = 1;

-- 高效：仅更新变更字段
UPDATE `order` SET status = 1 WHERE id = 1;

（2）用乐观锁替代悲观锁，减少锁等待

高并发更新场景（如扣减库存），用乐观锁（版本号）替代悲观锁（FOR UPDATE），避免长时间锁等待：

sql 复制代码

-- 订单表新增version字段
ALTER TABLE `order` ADD `version` int NOT NULL DEFAULT 1 COMMENT '版本号';

-- 乐观锁更新：仅版本号匹配时更新，无锁等待
UPDATE `order` 
SET status = 1, version = version + 1 
WHERE id = 1 AND version = 1;

（3）批量操作替代单条操作

高频写入场景（如批量创建订单），用批量 INSERT/UPDATE 替代单条操作，减少网络 IO 和事务开销：

sql 复制代码

-- 低效：单条插入（1000次请求）
INSERT INTO `order` (order_no, user_id) VALUES ('20240211001', 1);
INSERT INTO `order` (order_no, user_id) VALUES ('20240211002', 2);

-- 高效：批量插入（1次请求）
INSERT INTO `order` (order_no, user_id) 
VALUES ('20240211001', 1), ('20240211002', 2), ...; -- 建议单次批量不超过1000条

三、避坑指南：常见错误导致写入 / 更新低效

过度设计索引：认为索引越多越好，导致每次写入都要维护 5 + 个索引，效率骤降；
大事务写入：一个事务包含数百条 INSERT/UPDATE，长时间占用锁资源，引发锁等待；
用 UUID 做主键：导致 InnoDB 聚簇索引页分裂，碎片率高，写入速度比自增 ID 慢 50%+；
高频更新大字段 ：如频繁更新text/json字段，每次更新都要重新写入大段数据，IO 开销大；
未做分表：单表数据量超亿级仍不拆分，写入时磁盘 IO 和索引维护开销呈指数级增长。

四、效果验证方法

压测对比：用 JMeter / 压测工具对比优化前后的写入 / 更新 QPS（每秒处理请求数）；
监控指标：关注数据库的「慢更新 / 插入日志」「锁等待时间」「磁盘 IO 利用率」；
碎片率检查 ：用SHOW TABLE STATUS LIKE 'order'查看Data_free（碎片空间），碎片率过高需优化主键或重建表。

总结

索引层面：只保留必要索引，删除冗余 / 无效索引，慎用唯一索引，减少写入时的索引维护开销；
字段 / 主键层面：选最小数据类型、减少 NULL 值、用自增主键，降低存储和写入碎片化；
表结构层面：拆分大表、冷热分离，分散单表写入压力；
操作层面：精准更新、批量操作、乐观锁，减少锁冲突和冗余开销。

核心思路是「牺牲非必要的查询便利性，换取写入 / 更新效率」------ 在索引设计、表结构拆分上做取舍，优先保障高并发场景下的写入性能。

(07).以采集工业设备运行状态变化为案例，要求方便每日统计各种状态持续时长，怎样设计表结构，

以工业设备运行状态变化为场景设计数据库表结构，核心需求是能方便地统计每日各类状态的持续时长，这需要表结构既精准记录状态变化的时间节点，又能高效支撑时长计算的统计分析。

一、核心设计思路

工业设备状态统计的关键是「记录状态变更的时间点」，而非持续记录每一刻的状态（会产生海量冗余数据）。通过「状态变更流水表」记录每次状态切换的时间和状态值，统计时只需计算相邻两条记录的时间差，即可得到该状态的持续时长，再按日期聚合即可。

二、表结构设计（MySQL 为例）

1. 核心表：设备状态变更流水表（device_status_log）

这是核心表，记录每台设备每次状态变化的时间和状态值，是统计时长的基础：

sql 复制代码

CREATE TABLE `device_status_log` (
  `id` bigint unsigned NOT NULL AUTO_INCREMENT COMMENT '主键ID',
  `device_code` varchar(64) NOT NULL COMMENT '设备唯一编码（如设备编号/序列号）',
  `status` tinyint NOT NULL COMMENT '设备状态（枚举：0-离线，1-运行，2-待机，3-故障，4-维护）',
  `status_name` varchar(32) NOT NULL COMMENT '状态名称（冗余，避免关联字典表，提升查询效率）',
  `change_time` datetime NOT NULL COMMENT '状态变更时间（精确到秒）',
  `create_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '记录创建时间（防数据篡改）',
  `operator` varchar(32) DEFAULT '' COMMENT '操作人（手动变更时填写，自动采集填system）',
  `remark` varchar(255) DEFAULT '' COMMENT '备注（如故障原因、维护内容）',
  PRIMARY KEY (`id`),
  -- 核心索引：支撑按设备+时间范围查询（统计每日数据的核心）
  KEY `idx_device_time` (`device_code`, `change_time`),
  -- 辅助索引：支撑按状态+时间统计（如统计某日所有故障设备）
  KEY `idx_status_time` (`status`, `change_time`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='设备状态变更流水表';

2. 辅助表：设备基础信息表（device_base）

存储设备基础信息，关联流水表便于按设备维度统计（如按设备类型、车间统计）：

sql 复制代码

CREATE TABLE `device_base` (
  `id` bigint unsigned NOT NULL AUTO_INCREMENT COMMENT '主键ID',
  `device_code` varchar(64) NOT NULL COMMENT '设备唯一编码（与流水表一致）',
  `device_name` varchar(64) NOT NULL COMMENT '设备名称',
  `device_type` varchar(32) NOT NULL COMMENT '设备类型（如电机、泵体、传送带）',
  `workshop` varchar(32) NOT NULL COMMENT '所属车间',
  `status` tinyint NOT NULL DEFAULT 0 COMMENT '当前状态（冗余，实时展示用）',
  `last_change_time` datetime DEFAULT NULL COMMENT '最后一次状态变更时间',
  `create_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP,
  PRIMARY KEY (`id`),
  UNIQUE KEY `uk_device_code` (`device_code`), -- 保证设备编码唯一
  KEY `idx_device_type` (`device_type`), -- 按设备类型统计
  KEY `idx_workshop` (`workshop`) -- 按车间统计
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='设备基础信息表';

3. 可选表：状态字典表（status_dict）

若状态类型可能变更（如新增「检修」状态），可建字典表统一管理，流水表中status_name仍建议冗余（避免统计时关联字典表）：

sql 复制代码

CREATE TABLE `status_dict` (
  `id` tinyint unsigned NOT NULL COMMENT '状态编码',
  `status_name` varchar(32) NOT NULL COMMENT '状态名称',
  `sort` tinyint NOT NULL DEFAULT 0 COMMENT '排序',
  `remark` varchar(255) DEFAULT '' COMMENT '状态说明',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='设备状态字典表';

-- 初始化状态数据
INSERT INTO `status_dict` (id, status_name, remark) VALUES 
(0, '离线', '设备未通电/网络断开'),
(1, '运行', '设备正常生产运行'),
(2, '待机', '设备通电但未生产'),
(3, '故障', '设备异常停机'),
(4, '维护', '设备计划性维护');

三、关键设计细节（适配「每日统计状态时长」需求）

为什么用「变更流水表」而非「全量状态表」：
- 工业设备状态变化频率远低于「每秒 / 每分钟」，记录变更点可极大减少数据量（如一台设备每天仅变更 3-5 次，仅存 3-5 条记录）；
- 统计时长时，通过计算相邻两条记录的change_time差值即可得到状态持续时长，逻辑简单且高效。
索引设计的核心逻辑：
- idx_device_time (device_code, change_time)：统计单台设备某日的状态时长时，可快速筛选出该设备在指定日期范围内的所有状态变更记录；
- idx_status_time (status, change_time)：统计某日所有设备的「故障时长总和」时，可快速筛选出所有故障状态的变更记录。
冗余字段的必要性：
- status_name：流水表中冗余状态名称，统计时无需关联字典表，提升查询效率；
- 设备基础表中冗余current_status和last_change_time，可快速展示设备当前状态，无需每次查询流水表的最新记录。

四、每日状态时长统计示例（SQL 实现）

以下是统计「2024-02-11」单台设备（device_code='DEV001'）各状态持续时长的核心 SQL，可直接复用：

sql 复制代码

-- 步骤1：获取设备在统计日及前一日的状态变更记录（处理跨日状态）
WITH device_log AS (
  SELECT 
    device_code,
    status,
    status_name,
    change_time
  FROM `device_status_log`
  WHERE device_code = 'DEV001'
    -- 包含统计日前一天的最后一条记录（处理跨日状态）
    AND change_time >= '2024-02-10 00:00:00'
    AND change_time < '2024-02-12 00:00:00'
  ORDER BY change_time ASC
),
-- 步骤2：关联下一条记录的时间，计算状态持续时长
log_with_next AS (
  SELECT 
    device_code,
    status,
    status_name,
    change_time AS start_time,
    -- 下一条记录的时间（无则为统计日结束时间）
    COALESCE(
      LEAD(change_time) OVER (ORDER BY change_time),
      '2024-02-12 00:00:00'
    ) AS end_time
  FROM device_log
),
-- 步骤3：计算每条记录在统计日内的有效时长（秒）
duration_calc AS (
  SELECT 
    device_code,
    status,
    status_name,
    -- 取时间范围与统计日的交集，计算秒数
    TIMESTAMPDIFF(
      SECOND,
      -- 开始时间：取记录开始时间和统计日开始时间的较大值
      GREATEST(start_time, '2024-02-11 00:00:00'),
      -- 结束时间：取记录结束时间和统计日结束时间的较小值
      LEAST(end_time, '2024-02-12 00:00:00')
    ) AS duration_seconds
  FROM log_with_next
  WHERE TIMESTAMPDIFF(
    SECOND,
    GREATEST(start_time, '2024-02-11 00:00:00'),
    LEAST(end_time, '2024-02-12 00:00:00')
  ) > 0 -- 过滤掉时长为0的记录
)
-- 步骤4：按状态聚合，统计总时长（转换为小时/分钟更易读）
SELECT 
  status,
  status_name,
  SUM(duration_seconds) AS total_seconds,
  -- 转换为小时：保留2位小数
  ROUND(SUM(duration_seconds) / 3600, 2) AS total_hours,
  -- 转换为小时:分钟:秒
  SEC_TO_TIME(SUM(duration_seconds)) AS total_time
FROM duration_calc
GROUP BY status, status_name
ORDER BY status ASC;

五、优化建议（适配工业场景高可用 / 高性能需求）

数据分区 ：流水表按change_time做「按日期分区」（如每月一个分区），统计每日数据时仅扫描对应分区，提升查询效率：

sql 复制代码

-- 创建分区表（示例：按年月分区）
CREATE TABLE `device_status_log` (
  -- 字段定义同前
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4
PARTITION BY RANGE (TO_DAYS(change_time)) (
  PARTITION p202401 VALUES LESS THAN (TO_DAYS('2024-02-01')),
  PARTITION p202402 VALUES LESS THAN (TO_DAYS('2024-03-01')),
  PARTITION p202403 VALUES LESS THAN (TO_DAYS('2024-04-01'))
);

历史数据归档：将超过 6 个月的流水数据归档到「设备状态归档表（device_status_log_archive）」，核心表仅保留近期数据，减少查询压力。

定时预计算：每日凌晨通过定时任务（如 MySQL 事件、Python 脚本）预计算前一日的状态时长，结果存入「设备每日状态统计结果表」，业务查询时直接读取结果，无需实时计算：

sql 复制代码

CREATE TABLE `device_daily_status_stat` (
  `id` bigint unsigned NOT NULL AUTO_INCREMENT,
  `device_code` varchar(64) NOT NULL,
  `stat_date` date NOT NULL COMMENT '统计日期',
  `status` tinyint NOT NULL,
  `status_name` varchar(32) NOT NULL,
  `total_seconds` int NOT NULL COMMENT '总时长（秒）',
  `total_hours` decimal(10,2) NOT NULL COMMENT '总时长（小时）',
  `create_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP,
  PRIMARY KEY (`id`),
  UNIQUE KEY `uk_device_date_status` (`device_code`, `stat_date`, `status`), -- 唯一约束
  KEY `idx_stat_date` (`stat_date`) -- 按日期统计
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='设备每日状态统计结果表';

高并发写入适配 ：若设备数量多（上千台）、状态变更频繁，可将流水表按device_code哈希分表（如device_status_log_00-device_status_log_99），分散写入压力。

总结

核心表选择「状态变更流水表」，仅记录状态切换的时间点，通过计算时间差统计时长，避免海量冗余数据；
索引优先设计device_code + change_time，精准支撑单设备每日时长统计；
可通过「分区表 + 预计算结果表」进一步提升统计效率，适配工业场景的高性能需求；
冗余状态名称、设备当前状态等字段，平衡查询效率和数据一致性。