数据库优化:MySQL索引与查询优化
大家好,我是欧阳瑞(Rich Own)。今天想和大家聊聊数据库优化这个重要话题。作为一个全栈开发者,数据库性能是应用性能的关键。今天就来分享一下MySQL索引和查询优化的实战经验。
为什么需要数据库优化?
| 问题 | 影响 |
|---|---|
| 慢查询 | 响应延迟增加 |
| 高IO | 服务器负载过高 |
| 锁竞争 | 并发性能下降 |
| 资源浪费 | 成本增加 |
索引基础
什么是索引?
索引是一种数据结构,用于加速数据库查询。它就像一本书的目录,可以快速定位到需要的数据。
索引类型
| 类型 | 说明 |
|---|---|
| B-Tree | 默认索引类型 |
| Hash | 等值查询快 |
| Full-Text | 全文搜索 |
| Spatial | 空间数据 |
创建索引
sql
-- 创建单列索引
CREATE INDEX idx_name ON users(name);
-- 创建复合索引
CREATE INDEX idx_name_age ON users(name, age);
-- 创建唯一索引
CREATE UNIQUE INDEX idx_email ON users(email);
-- 创建全文索引
CREATE FULLTEXT INDEX idx_content ON articles(content);
索引失效场景
sql
-- 1. 使用函数
SELECT * FROM users WHERE YEAR(create_time) = 2023; -- 索引失效
-- 2. 使用OR
SELECT * FROM users WHERE name = 'Alice' OR age = 30; -- 可能失效
-- 3. 类型转换
SELECT * FROM users WHERE id = '123'; -- 索引失效
-- 4. LIKE以%开头
SELECT * FROM users WHERE name LIKE '%Alice'; -- 索引失效
-- 5. 范围查询后使用其他列
SELECT * FROM users WHERE age > 30 AND name = 'Alice'; -- name索引失效
查询优化
慢查询日志
sql
-- 开启慢查询日志
SET GLOBAL slow_query_log = ON;
SET GLOBAL slow_query_log_file = '/var/log/mysql/slow.log';
SET GLOBAL long_query_time = 2; -- 超过2秒的查询记录
-- 查看慢查询日志
SHOW PROCESSLIST;
EXPLAIN分析
sql
EXPLAIN SELECT * FROM users WHERE name = 'Alice';
-- 输出解读
-- type: ALL < index < range < ref < eq_ref < const
-- key: 使用的索引
-- rows: 预计扫描行数
-- Extra: Using index, Using where, Using filesort
查询优化技巧
sql
-- 1. 避免SELECT *
SELECT name, age FROM users WHERE id = 1; -- 好
-- 2. 使用覆盖索引
SELECT id, name FROM users WHERE name = 'Alice'; -- 使用idx_name索引
-- 3. 优化JOIN
SELECT u.name, o.amount
FROM users u
JOIN orders o ON u.id = o.user_id
WHERE u.id = 1;
-- 4. 子查询优化
-- 不好
SELECT * FROM users WHERE id IN (SELECT user_id FROM orders);
-- 好
SELECT u.* FROM users u
JOIN orders o ON u.id = o.user_id;
表结构优化
数据类型选择
| 类型 | 场景 |
|---|---|
| INT | 整数ID |
| VARCHAR | 可变长度字符串 |
| DATE/DATETIME | 日期时间 |
| DECIMAL | 精确小数 |
| ENUM | 枚举值 |
范式与反范式
sql
-- 范式化
CREATE TABLE users (
id INT PRIMARY KEY,
name VARCHAR(100)
);
CREATE TABLE orders (
id INT PRIMARY KEY,
user_id INT,
amount DECIMAL(10,2),
FOREIGN KEY (user_id) REFERENCES users(id)
);
-- 反范式化(性能优化)
CREATE TABLE orders (
id INT PRIMARY KEY,
user_id INT,
user_name VARCHAR(100), -- 冗余字段
amount DECIMAL(10,2)
);
分区表
sql
-- 按时间分区
CREATE TABLE logs (
id INT,
log_time DATETIME,
content TEXT
)
PARTITION BY RANGE (TO_DAYS(log_time)) (
PARTITION p202301 VALUES LESS THAN (TO_DAYS('2023-02-01')),
PARTITION p202302 VALUES LESS THAN (TO_DAYS('2023-03-01')),
PARTITION p202303 VALUES LESS THAN (TO_DAYS('2023-04-01'))
);
实战案例
优化前
sql
-- 慢查询
SELECT * FROM orders
WHERE status = 'completed'
AND create_time > '2023-01-01'
ORDER BY amount DESC
LIMIT 100;
-- EXPLAIN结果
-- type: ALL
-- rows: 1000000
-- Extra: Using where; Using filesort
优化后
sql
-- 创建复合索引
CREATE INDEX idx_status_create_time_amount ON orders(status, create_time, amount);
-- 查询
SELECT id, user_id, amount FROM orders
WHERE status = 'completed'
AND create_time > '2023-01-01'
ORDER BY amount DESC
LIMIT 100;
-- EXPLAIN结果
-- type: range
-- key: idx_status_create_time_amount
-- rows: 100
-- Extra: Using where; Backward index scan
最佳实践
1. 定期分析表
sql
ANALYZE TABLE users;
ANALYZE TABLE orders;
2. 重建索引
sql
ALTER TABLE users ENGINE=InnoDB; -- 重建所有索引
3. 使用缓存
python
import redis
r = redis.Redis(host='localhost', port=6379)
def get_user(user_id):
cache_key = f'user:{user_id}'
cached = r.get(cache_key)
if cached:
return json.loads(cached)
user = db.query("SELECT * FROM users WHERE id = %s", user_id)
r.setex(cache_key, 3600, json.dumps(user))
return user
总结
数据库优化是一个持续的过程。通过合理的索引设计、查询优化和表结构设计,可以显著提升数据库性能。
我的鬃狮蜥Hash对数据库优化也有自己的理解------它总是记住蟋蟀经常出现的位置,这也许就是自然界的"索引"吧!
如果你对数据库优化感兴趣,欢迎留言交流!我是欧阳瑞,极客之路,永无止境!
技术栈:MySQL · 索引优化 · 查询优化