1.场景
一个后台服务项目, 当访问某个接口时一直在请求,后面报504超时,日志查看,出现了"MISCONF Redis is configured to save RDB snapshots, but it's currently unable to persist to disk. Commands that may modify the data set are disabled, because this instance is configured to report errors during writes if RDB snapshotting fails (stop-writes-on-bgsave-error option). Please check the Redis logs for details about the RDB error."错误
2.原因分析
出现上面错误的原因是因为Redis 的持久化机制触发了保护机制
3.快速诊断和修复步骤
第一步:立即检查状态
bash
# 连接到 Redis
redis-cli
# 查看 Redis 信息
INFO persistence
INFO memory
INFO server
# 检查当前配置
CONFIG GET stop-writes-on-bgsave-error
CONFIG GET dir
CONFIG GET dbfilename
第二步:常见原因和立即修复
A. 磁盘空间不足(最常见)(我这次就是这个原因导致的)
bash
# 查看磁盘使用
df -h
df -i # 查看 inode 使用
# 清理空间
# 1. 清理 Redis 旧备份
find /var/lib/redis -name "*.rdb.*" -mtime +7 -delete
find /var/lib/redis -name "*.aof" -size +100M -delete
# 2. 清理日志
sudo journalctl --vacuum-time=3d
sudo find /var/log -name "*.log" -size +50M -delete
B. 权限问题
bash
# 检查 Redis 数据目录权限
ls -la /var/lib/redis/
# 修复权限
sudo chown -R redis:redis /var/lib/redis
sudo chmod 755 /var/lib/redis
C. 内存不足
bash
# 检查内存
free -h
# 如果是容器环境
docker stats
第三步:立即恢复写入(应急方案)
方案1:临时禁用保护(5分钟内恢复服务)
bash
# 连接到 Redis
redis-cli
# 临时关闭写入保护
CONFIG SET stop-writes-on-bgsave-error no
# 验证写入是否恢复
SET test_key "test_value"
GET test_key
方案2:更改持久化方式
bash
# 切换到 AOF 持久化
CONFIG SET appendonly yes
CONFIG SET appendfsync everysec
# 或者完全禁用持久化(仅用于紧急恢复)
CONFIG SET save ""
第四步:查看详细错误日志
bash
# 查看 Redis 日志
sudo tail -f /var/log/redis/redis-server.log
# 如果没有日志文件,检查配置
redis-cli CONFIG GET logfile
redis-cli CONFIG GET loglevel
# 设置日志级别为详细
CONFIG SET loglevel debug
# 然后重试操作,查看日志
第五步:永久修复配置
编辑
/etc/redis/redis.conf
bash
# 调整 RDB 保存条件
# save 900 1
# save 300 10
# save 60 10000
# 或者完全禁用 RDB
save ""
# 启用 AOF
appendonly yes
appendfilename "appendonly.aof"
appendfsync everysec
# 调整数据目录到有空间的位置
dir /opt/redis-data
# 调整内存策略
maxmemory 2gb
maxmemory-policy allkeys-lru
# 关闭保护(不推荐,仅用于测试环境)
stop-writes-on-bgsave-error no
第六步:重启 Redis
bash
# 测试配置文件
redis-server /etc/redis/redis.conf --test
# 安全重启
sudo systemctl restart redis
# 或
sudo redis-cli shutdown
sudo systemctl start redis
第七步:预防措施
bash
# 1. 设置监控脚本
cat > /usr/local/bin/check_redis.sh << 'EOF'
#!/bin/bash
if redis-cli ping | grep -q "PONG"; then
if redis-cli info | grep -q "rdb_last_bgsave_status:ok"; then
echo "Redis OK"
else
echo "Redis备份失败!" | mail -s "Redis告警" admin@example.com
fi
else
echo "Redis宕机!" | mail -s "紧急告警" admin@example.com
fi
EOF
# 2. 添加到定时任务
echo "*/5 * * * * root /usr/local/bin/check_redis.sh" >> /etc/crontab
如果上述方法都不行,最后的手段
4.导出数据并重建实例
bash
# 导出数据
redis-cli --rdb /tmp/dump.rdb
# 停止 Redis
sudo systemctl stop redis
# 备份配置
cp /etc/redis/redis.conf /etc/redis/redis.conf.backup
# 清空数据目录
rm -rf /var/lib/redis/*
# 重新启动
sudo systemctl start redis
# 如果需要,重新导入数据
cat /tmp/dump.rdb | redis-cli --pipe
2.使用 Docker 重新部署
bash
docker run -d --name redis \
-v /opt/redis-data:/data \
-p 6379:6379 \
redis:alpine redis-server \
--appendonly yes \
--stop-writes-on-bgsave-error no