艾体宝干货 | Redis Python 开发系列#6 缓存、分布式锁与队列架构

本文是 Redis × Python 系列终篇，综合运用所有知识，提供生产级的缓存模式、分布式锁和消息队列完整解决方案，包含异常处理、性能优化和监控最佳实践。

前言

经过前五篇的系统学习，我们已经掌握了 Redis 从基础连接到高级特性的所有核心知识。现在，让我们将这些知识融会贯通，构建生产级别 的解决方案。本篇将深入探讨现代分布式系统中三个最关键的 Redis 应用模式：缓存策略 、分布式锁 和消息队列。

本篇读者收益：

掌握完整的缓存策略，包括 Cache-Aside 模式及缓存穿透、击穿、雪崩的治理方案。
实现健壮的分布式锁，包含自动续期、可重入性和容错机制。
构建可靠的消息队列，支持优先级、重试和死信处理。
学会全面的错误处理、重试策略和监控方案，确保生产环境稳定性。

先修要求：已掌握本系列前五篇的所有内容，包括数据结构、事务管道、高可用集群等。

关键要点：

缓存不是万能的：错误的缓存策略比不用缓存更危险，必须处理穿透、击穿、雪崩三大问题。
分布式锁的魔鬼在细节中 ：简单的 SET NX 远远不够，必须考虑锁续期、重入和网络分区。
消息队列需要可靠性 ：简单的 LPOP/RPUSH 无法满足生产要求，需要 ACK 机制和重试策略。
监控是生产环境的眼睛：没有监控的 Redis 应用迟早会出事。

背景与原理简述

在分布式系统中，Redis 通常有三种用例：

缓存层：通过内存高速访问特性，减轻后端数据库压力，提升系统响应速度。
分布式协调：通过原子操作和过期机制，实现跨进程、跨服务的协调与同步。
消息中间件：通过 Pub/Sub 和阻塞列表操作，实现服务间的异步通信和解耦。

将基础能力转化为生产可用的解决方案，需要处理并应对各种边界情况和故障模式。本篇将为此提供一些方案指导。

环境准备与快速上手

生产环境依赖

Bash 复制代码

# 安装核心依赖
pip install "redis[hiredis]"
pip install redis-py-cluster

# 可选：用于更复杂的序列化和监控
pip install msgpack python-json-logger prometheus-client

基础配置

Python 复制代码

# filename: production_setup.py
import os
import logging
import redis
from redis.cluster import RedisCluster
from redis.sentinel import Sentinel

# 配置日志
logging.basicConfig(
    level=logging.INFO,
    format='%(asctime)s - %(name)s - %(levelname)s - %(message)s'
)
logger = logging.getLogger(__name__)

class ProductionRedisClient:
    """生产环境 Redis 客户端工厂"""
    
    @staticmethod
    def create_client():
        """根据环境变量创建对应的 Redis 客户端"""
        redis_mode = os.getenv('REDIS_MODE', 'standalone')
        
        if redis_mode == 'cluster':
            startup_nodes = [
                {"host": os.getenv('REDIS_CLUSTER_HOST'), "port": int(os.getenv('REDIS_PORT', 6379))}
            ]
            return RedisCluster(
                startup_nodes=startup_nodes,
                password=os.getenv('REDIS_PASSWORD'),
                decode_responses=True,
                socket_connect_timeout=5,
                socket_timeout=5,
                retry_on_timeout=True,
                max_connections_per_node=20
            )
        elif redis_mode == 'sentinel':
            sentinel = Sentinel([
                (os.getenv('REDIS_SENTINEL_HOST'), int(os.getenv('REDIS_SENTINEL_PORT', 26379)))
            ], socket_timeout=1)
            return sentinel.master_for(
                os.getenv('REDIS_SENTINEL_MASTER', 'mymaster'),
                password=os.getenv('REDIS_PASSWORD'),
                socket_timeout=1,
                decode_responses=True
            )
        else:
            # 单机模式
            return redis.Redis(
                host=os.getenv('REDIS_HOST', 'localhost'),
                port=int(os.getenv('REDIS_PORT', 6379)),
                password=os.getenv('REDIS_PASSWORD'),
                decode_responses=True,
                socket_connect_timeout=5,
                socket_timeout=5,
                retry_on_timeout=True
            )

# 创建全局客户端实例
redis_client = ProductionRedisClient.create_client()

核心用法与代码示例

高级缓存模式

完整的缓存管理器

Python 复制代码

# filename: advanced_cache.py
import json
import pickle
import hashlib
import time
from typing import Any, Optional, Callable
from functools import wraps

class AdvancedCacheManager:
    """
    高级缓存管理器
    支持多种序列化方式、缓存穿透保护和优雅降级
    """
    
    def __init__(self, redis_client, default_ttl: int = 3600):
        self.r = redis_client
        self.default_ttl = default_ttl
        # 空值缓存时间（防穿透）
        self.null_ttl = 300
        
    def _make_key(self, prefix: str, *args, **kwargs) -> str:
        """生成一致的缓存键"""
        key_parts = [prefix] + [str(arg) for arg in args]
        key_parts.extend([f"{k}:{v}" for k, v in sorted(kwargs.items())])
        key_string = ":".join(key_parts)
        return f"cache:{hashlib.md5(key_string.encode()).hexdigest()}"
    
    def get_or_set(self, key: str, builder: Callable, ttl: Optional[int] = None, 
                   serialize: str = 'json') -> Any:
        """
        获取或设置缓存（Cache-Aside 模式）
        """
        # 1. 尝试从缓存获取
        cached = self.r.get(key)
        if cached is not None:
            if cached == "__NULL__":  # 空值标记
                return None
            try:
                return self._deserialize(cached, serialize)
            except Exception as e:
                logger.warning(f"缓存反序列化失败 {key}: {e}")
                # 继续执行 builder
        
        # 2. 缓存未命中，构建数据
        try:
            data = builder()
        except Exception as e:
            logger.error(f"缓存数据构建失败 {key}: {e}")
            raise
        
        # 3. 写入缓存
        try:
            if data is None:
                # 缓存空值，防止缓存穿透
                self.r.setex(key, self.null_ttl, "__NULL__")
            else:
                serialized_data = self._serialize(data, serialize)
                self.r.setex(key, ttl or self.default_ttl, serialized_data)
        except Exception as e:
            logger.error(f"缓存写入失败 {key}: {e}")
            # 缓存写入失败不应影响主流程
        
        return data
    
    def cache_decorator(self, ttl: int = None, key_prefix: str = "func", 
                       serialize: str = 'json', fallback: bool = True):
        """
        缓存装饰器
        """
        def decorator(func):
            @wraps(func)
            def wrapper(*args, **kwargs):
                cache_key = self._make_key(key_prefix, func.__name__, *args, **kwargs)
                
                try:
                    return self.get_or_set(cache_key, lambda: func(*args, **kwargs), 
                                         ttl, serialize)
                except Exception as e:
                    if fallback:
                        logger.warning(f"缓存降级 {cache_key}: {e}")
                        return func(*args, **kwargs)
                    else:
                        raise
            return wrapper
        return decorator
    
    def invalidate_pattern(self, pattern: str) -> int:
        """根据模式失效缓存（使用 SCAN 避免阻塞）"""
        keys = []
        cursor = 0
        while True:
            cursor, found_keys = self.r.scan(cursor, match=f"cache:{pattern}*", count=100)
            keys.extend(found_keys)
            if cursor == 0:
                break
        
        if keys:
            return self.r.delete(*keys)
        return 0
    
    def _serialize(self, data: Any, method: str) -> str:
        """序列化数据"""
        if method == 'json':
            return json.dumps(data, ensure_ascii=False)
        elif method == 'pickle':
            return pickle.dumps(data).hex()
        else:
            return str(data)
    
    def _deserialize(self, data: str, method: str) -> Any:
        """反序列化数据"""
        if method == 'json':
            return json.loads(data)
        elif method == 'pickle':
            return pickle.loads(bytes.fromhex(data))
        else:
            return data

# 使用示例
cache_manager = AdvancedCacheManager(redis_client, default_ttl=1800)

@cache_manager.cache_decorator(ttl=600, key_prefix="user_data")
def get_user_profile(user_id: int) -> dict:
    """模拟从数据库获取用户资料"""
    logger.info(f"查询数据库获取用户 {user_id} 资料")
    # 模拟数据库查询
    time.sleep(0.1)
    return {
        "id": user_id,
        "name": f"User {user_id}",
        "email": f"user{user_id}@example.com",
        "last_login": time.time()
    }

# 测试缓存
user = get_user_profile(123)  # 第一次调用，会查询数据库
user = get_user_profile(123)  # 第二次调用，从缓存获取

缓存问题治理方案

Python 复制代码

# filename: cache_problem_solver.py
class CacheProblemSolver:
    """
    缓存问题综合治理
    - 缓存穿透 (Cache Penetration)
    - 缓存击穿 (Cache Breakdown) 
    - 缓存雪崩 (Cache Avalanche)
    """
    
    def __init__(self, redis_client):
        self.r = redis_client
    
    def solve_penetration(self, key: str, builder: Callable, ttl: int = 300):
        """
        解决缓存穿透：缓存空值 + 布隆过滤器（简化版）
        """
        # 检查空值缓存
        null_key = f"null:{key}"
        if self.r.exists(null_key):
            return None
        
        # 获取数据
        data = self.r.get(key)
        if data == "__NULL__":
            return None
        elif data is not None:
            return json.loads(data)
        
        # 缓存未命中，构建数据
        result = builder()
        if result is None:
            # 缓存空值，防止穿透
            self.r.setex(null_key, ttl, "1")
            self.r.setex(key, ttl, "__NULL__")
        else:
            self.r.setex(key, ttl, json.dumps(result))
        
        return result
    
    def solve_breakdown(self, key: str, builder: Callable, ttl: int = 3600, 
                       lock_timeout: int = 10):
        """
        解决缓存击穿：分布式锁保护数据库查询
        """
        # 1. 检查缓存
        cached = self.r.get(key)
        if cached and cached != "__NULL__":
            return json.loads(cached)
        
        # 2. 尝试获取分布式锁
        lock_key = f"lock:{key}"
        lock_identifier = str(time.time())
        
        # 获取锁
        lock_acquired = self.r.set(lock_key, lock_identifier, nx=True, ex=lock_timeout)
        if lock_acquired:
            try:
                # 双重检查
                cached = self.r.get(key)
                if cached and cached != "__NULL__":
                    return json.loads(cached)
                
                # 查询数据库
                result = builder()
                if result is None:
                    self.r.setex(key, 300, "__NULL__")  # 短期空值缓存
                else:
                    self.r.setex(key, ttl, json.dumps(result))
                return result
            finally:
                # 释放锁（确保只释放自己的锁）
                if self.r.get(lock_key) == lock_identifier:
                    self.r.delete(lock_key)
        else:
            # 未获取到锁，等待并重试
            time.sleep(0.1)
            return self.solve_breakdown(key, builder, ttl, lock_timeout)
    
    def solve_avalanche(self, keys_ttl_map: dict, base_ttl: int = 3600):
        """
        解决缓存雪崩：随机过期时间 + 永不过期+后台刷新策略
        """
        import random
        
        for key_pattern, expected_ttl in keys_ttl_map.items():
            # 为每个键添加随机偏移量（±10%）
            ttl_with_jitter = int(expected_ttl * (0.9 + 0.2 * random.random()))
            
            # 或者使用永不过期 + 后台刷新策略
            # 这里使用随机 TTL
            logger.info(f"键 {key_pattern} 设置 TTL: {ttl_with_jitter}")
            
        return True

# 使用示例
problem_solver = CacheProblemSolver(redis_client)

# 防止穿透的查询
def query_product(product_id):
    """模拟数据库查询"""
    if product_id > 1000:  # 模拟不存在的商品
        return None
    return {"id": product_id, "name": f"Product {product_id}"}

# 测试缓存穿透防护
result = problem_solver.solve_penetration("product:9999", lambda: query_product(9999))
print(f"不存在的商品: {result}")  # 返回 None，但会缓存空值

# 测试缓存击穿防护  
result = problem_solver.solve_breakdown("product:123", lambda: query_product(123))
print(f"存在的商品: {result}")

健壮的分布式锁

Python 复制代码

# filename: robust_distributed_lock.py
import time
import threading
import uuid
from contextlib import contextmanager
from typing import Optional

class RobustDistributedLock:
    """
    健壮的分布式锁实现
    特性：
    - 自动续期
    - 可重入性
    - 容错机制
    - 超时控制
    """
    
    def __init__(self, redis_client, lock_key: str, timeout: int = 30, 
                 retry_delay: float = 0.1, max_retries: int = 10):
        self.r = redis_client
        self.lock_key = f"lock:{lock_key}"
        self.timeout = timeout
        self.retry_delay = retry_delay
        self.max_retries = max_retries
        self.identifier = str(uuid.uuid4())
        self._renewal_thread = None
        self._renewal_active = False
        self._lock_count = 0
        
        # Lua 脚本确保原子性
        self._acquire_script = self.r.register_script("""
            return redis.call('set', KEYS[1], ARGV[1], 'NX', 'EX', ARGV[2])
        """)
        
        self._release_script = self.r.register_script("""
            if redis.call('get', KEYS[1]) == ARGV[1] then
                return redis.call('del', KEYS[1])
            else
                return 0
            end
        """)
        
        self._renew_script = self.r.register_script("""
            if redis.call('get', KEYS[1]) == ARGV[1] then
                return redis.call('expire', KEYS[1], ARGV[2])
            else
                return 0
            end
        """)
    
    def acquire(self, blocking: bool = True, timeout: Optional[float] = None) -> bool:
        """获取锁"""
        if timeout is None:
            timeout = self.timeout
        
        retries = 0
        start_time = time.time()
        
        while retries < self.max_retries:
            # 尝试获取锁
            result = self._acquire_script(keys=[self.lock_key], 
                                        args=[self.identifier, self.timeout])
            if result is not None:
                self._lock_count += 1
                self._start_renewal()
                return True
            
            if not blocking:
                return False
            
            # 检查是否超时
            if time.time() - start_time > timeout:
                return False
            
            # 等待重试
            time.sleep(self.retry_delay)
            retries += 1
        
        return False
    
    def release(self) -> bool:
        """释放锁"""
        if self._lock_count > 0:
            self._lock_count -= 1
            
            if self._lock_count == 0:
                self._stop_renewal()
                result = self._release_script(keys=[self.lock_key], args=[self.identifier])
                return result == 1
        
        return False
    
    def _start_renewal(self):
        """启动锁续期线程"""
        if self._renewal_thread is None or not self._renewal_thread.is_alive():
            self._renewal_active = True
            self._renewal_thread = threading.Thread(target=self._renewal_worker, daemon=True)
            self._renewal_thread.start()
    
    def _stop_renewal(self):
        """停止锁续期"""
        self._renewal_active = False
        if self._renewal_thread and self._renewal_thread.is_alive():
            self._renewal_thread.join(timeout=1)
    
    def _renewal_worker(self):
        """锁续期工作线程"""
        renewal_interval = self.timeout // 3  # 在过期前1/3时间开始续期
        
        while self._renewal_active and self._lock_count > 0:
            time.sleep(renewal_interval)
            
            if not self._renewal_active:
                break
                
            try:
                result = self._renew_script(keys=[self.lock_key], 
                                          args=[self.identifier, self.timeout])
                if result == 0:
                    logger.warning(f"锁续期失败: {self.lock_key}")
                    break
                else:
                    logger.debug(f"锁续期成功: {self.lock_key}")
            except Exception as e:
                logger.error(f"锁续期异常: {e}")
                break
    
    @contextmanager
    def lock(self, timeout: Optional[float] = None):
        """上下文管理器"""
        acquired = self.acquire(timeout=timeout)
        if not acquired:
            raise RuntimeError(f"获取锁失败: {self.lock_key}")
        try:
            yield
        finally:
            self.release()
    
    def __enter__(self):
        self.acquire()
        return self
    
    def __exit__(self, exc_type, exc_val, exc_tb):
        self.release()

# 使用示例
def test_distributed_lock():
    """测试分布式锁"""
    lock = RobustDistributedLock(redis_client, "critical_resource", timeout=10)
    
    # 方式1: 使用上下文管理器（推荐）
    with lock.lock():
        print("在锁保护下执行操作...")
        time.sleep(3)
        # 关键操作
        redis_client.incr("locked_counter")
    
    # 方式2: 手动管理
    if lock.acquire(timeout=5):
        try:
            print("手动获取锁成功")
            # 关键操作
            time.sleep(2)
        finally:
            lock.release()
    else:
        print("获取锁超时")

# 测试重入性
def test_reentrant_lock():
    """测试可重入锁"""
    lock = RobustDistributedLock(redis_client, "reentrant_resource")
    
    def inner_function():
        with lock.lock():  # 同一线程内可重入
            print("内层锁获取成功")
    
    with lock.lock():
        print("外层锁获取成功")
        inner_function()
        print("内外层锁都释放")

test_distributed_lock()
test_reentrant_lock()

可靠消息队列

Python 复制代码

# filename: reliable_message_queue.py
import json
import time
import threading
from typing import Dict, Any, Optional, List
from enum import Enum

class MessageStatus(Enum):
    PENDING = "pending"
    PROCESSING = "processing"
    SUCCESS = "success"
    FAILED = "failed"

class ReliableMessageQueue:
    """
    可靠消息队列实现
    特性：
    - 优先级支持
    - 重试机制
    - 死信队列
    - 消息确认
    """
    
    def __init__(self, redis_client, queue_name: str):
        self.r = redis_client
        self.queue_name = queue_name
        self.processing_queue = f"{queue_name}:processing"
        self.failed_queue = f"{queue_name}:failed"
        self.dlq = f"{queue_name}:dlq"  # 死信队列
        self.stats_key = f"{queue_name}:stats"
    
    def enqueue(self, message: Dict[str, Any], priority: int = 0, 
                delay: int = 0) -> str:
        """入队消息"""
        message_id = str(uuid.uuid4())
        message_data = {
            'id': message_id,
            'data': message,
            'created_at': time.time(),
            'priority': priority,
            'attempts': 0,
            'max_attempts': 3,
            'status': MessageStatus.PENDING.value
        }
        
        serialized = json.dumps(message_data)
        
        if delay > 0:
            # 延迟消息使用有序集合
            score = time.time() + delay
            self.r.zadd(f"{self.queue_name}:delayed", {serialized: score})
        elif priority > 0:
            # 高优先级消息
            self.r.zadd(f"{self.queue_name}:priority", {serialized: -priority})  # 负数实现高优先在前
        else:
            # 普通消息
            self.r.lpush(self.queue_name, serialized)
        
        self._update_stats('enqueued')
        return message_id
    
    def dequeue(self, timeout: int = 5) -> Optional[Dict[str, Any]]:
        """出队消息"""
        # 1. 检查延迟消息
        now = time.time()
        delayed_messages = self.r.zrangebyscore(f"{self.queue_name}:delayed", 0, now, start=0, num=1)
        if delayed_messages:
            message_data = json.loads(delayed_messages[0])
            self.r.zrem(f"{self.queue_name}:delayed", delayed_messages[0])
            self.r.lpush(self.queue_name, json.dumps(message_data))
        
        # 2. 检查优先级消息
        priority_messages = self.r.zrange(f"{self.queue_name}:priority", 0, 0)
        if priority_messages:
            message_data = json.loads(priority_messages[0])
            self.r.zrem(f"{self.queue_name}:priority", priority_messages[0])
            message_data['status'] = MessageStatus.PROCESSING.value
            # 移动到处理队列
            self.r.lpush(self.processing_queue, json.dumps(message_data))
            self._update_stats('dequeued')
            return message_data
        
        # 3. 检查普通消息
        if timeout > 0:
            result = self.r.brpop(self.queue_name, timeout=timeout)
        else:
            result = self.r.rpop(self.queue_name)
        
        if result:
            message_data = json.loads(result[1] if isinstance(result, tuple) else result)
            message_data['status'] = MessageStatus.PROCESSING.value
            # 移动到处理队列
            self.r.lpush(self.processing_queue, json.dumps(message_data))
            self._update_stats('dequeued')
            return message_data
        
        return None
    
    def ack(self, message_id: str) -> bool:
        """确认消息处理成功"""
        return self._update_message_status(message_id, MessageStatus.SUCCESS)
    
    def nack(self, message_id: str) -> bool:
        """拒绝消息（重试或进入死信队列）"""
        processing_messages = self.r.lrange(self.processing_queue, 0, -1)
        
        for msg_str in processing_messages:
            msg_data = json.loads(msg_str)
            if msg_data['id'] == message_id:
                msg_data['attempts'] += 1
                
                # 从处理队列移除
                self.r.lrem(self.processing_queue, 1, msg_str)
                
                if msg_data['attempts'] < msg_data['max_attempts']:
                    # 重试：重新入队，降低优先级
                    msg_data['priority'] = max(0, msg_data.get('priority', 0) - 1)
                    msg_data['status'] = MessageStatus.PENDING.value
                    self.r.lpush(self.queue_name, json.dumps(msg_data))
                    self._update_stats('retried')
                    return True
                else:
                    # 达到最大重试次数，进入死信队列
                    msg_data['status'] = MessageStatus.FAILED.value
                    msg_data['failed_at'] = time.time()
                    self.r.lpush(self.dlq, json.dumps(msg_data))
                    self._update_stats('failed')
                    return True
        
        return False
    
    def get_stats(self) -> Dict[str, int]:
        """获取队列统计信息"""
        stats = self.r.hgetall(self.stats_key)
        return {k: int(v) for k, v in stats.items()}
    
    def _update_message_status(self, message_id: str, status: MessageStatus) -> bool:
        """更新消息状态"""
        processing_messages = self.r.lrange(self.processing_queue, 0, -1)
        
        for msg_str in processing_messages:
            msg_data = json.loads(msg_str)
            if msg_data['id'] == message_id:
                # 从处理队列移除
                self.r.lrem(self.processing_queue, 1, msg_str)
                
                if status == MessageStatus.SUCCESS:
                    self._update_stats('processed')
                elif status == MessageStatus.FAILED:
                    self._update_stats('failed')
                
                return True
        
        return False
    
    def _update_stats(self, metric: str):
        """更新统计指标"""
        self.r.hincrby(self.stats_key, metric, 1)
    
    def cleanup_orphaned_messages(self, timeout: int = 3600):
        """清理孤儿消息（处理超时未确认的消息）"""
        processing_messages = self.r.lrange(self.processing_queue, 0, -1)
        now = time.time()
        reclaimed = 0
        
        for msg_str in processing_messages:
            msg_data = json.loads(msg_str)
            # 简单策略：检查消息年龄
            if now - msg_data.get('created_at', now) > timeout:
                self.r.lrem(self.processing_queue, 1, msg_str)
                # 重新入队或进入死信队列
                if msg_data['attempts'] < msg_data.get('max_attempts', 3):
                    self.r.lpush(self.queue_name, json.dumps(msg_data))
                else:
                    self.r.lpush(self.dlq, json.dumps(msg_data))
                reclaimed += 1
        
        return reclaimed

# 使用示例
def demo_message_queue():
    """演示消息队列使用"""
    queue = ReliableMessageQueue(redis_client, 'email_queue')
    
    # 生产者
    def producer():
        for i in range(5):
            message = {
                'to': f'user{i}@example.com',
                'subject': f'Test Email {i}',
                'body': f'This is test email {i}'
            }
            # 普通消息
            queue.enqueue(message)
            # 高优先级消息
            if i % 2 == 0:
                queue.enqueue(message, priority=10)
            time.sleep(0.1)
    
    # 消费者
    def consumer(worker_id: str):
        print(f"消费者 {worker_id} 启动")
        while True:
            message = queue.dequeue(timeout=2)
            if not message:
                print(f"消费者 {worker_id} 无消息，退出")
                break
            
            try:
                print(f"消费者 {worker_id} 处理消息: {message['id']}")
                # 模拟处理
                time.sleep(0.5)
                
                # 随机失败测试重试机制
                if "2" in message['id'] and message['attempts'] == 0:
                    raise Exception("模拟处理失败")
                
                # 确认消息
                queue.ack(message['id'])
                print(f"消费者 {worker_id} 处理成功: {message['id']}")
                
            except Exception as e:
                print(f"消费者 {worker_id} 处理失败: {e}")
                queue.nack(message['id'])
    
    # 启动生产者和消费者
    producer_thread = threading.Thread(target=producer)
    consumer_thread = threading.Thread(target=consumer, args=('worker1',))
    
    producer_thread.start()
    consumer_thread.start()
    
    producer_thread.join()
    consumer_thread.join()
    
    # 查看统计
    stats = queue.get_stats()
    print(f"队列统计: {stats}")

demo_message_queue()

安全与可靠性

生产环境配置检查

Python 复制代码

# filename: security_check.py
class SecurityChecker:
    """安全配置检查器"""
    
    @staticmethod
    def validate_redis_config(client):
        """验证 Redis 安全配置"""
        warnings = []
        
        try:
            config = client.config_get('*')
            
            # 检查密码设置
            requirepass = config.get('requirepass')
            if not requirepass:
                warnings.append("未设置 Redis 密码 (requirepass)")
            
            # 检查绑定地址
            bind = config.get('bind')
            if bind == '127.0.0.1' or bind == 'localhost':
                warnings.append("Redis 绑定到本地地址，可能无法远程访问")
            
            # 检查保护模式
            protected_mode = config.get('protected-mode')
            if protected_mode == 'no':
                warnings.append("保护模式已关闭")
                
            # 检查命令重命名
            renamed_commands = {
                'FLUSHALL', 'FLUSHDB', 'KEYS', 'CONFIG', 'SHUTDOWN'
            }
            for cmd in renamed_commands:
                if config.get(f'rename-command-{cmd}') is None:
                    warnings.append(f"危险命令 {cmd} 未重命名")
            
            return warnings
            
        except Exception as e:
            return [f"配置检查失败: {e}"]

综合故障排查

Python 复制代码

# filename: troubleshooting.py
class RedisTroubleshooter:
    """Redis 故障排查器"""
    
    def __init__(self, client):
        self.client = client
    
    def diagnose_common_issues(self):
        """诊断常见问题"""
        issues = []
        
        # 检查连接
        if not self._check_connectivity():
            issues.append("无法连接到 Redis 服务器")
            return issues
        
        # 检查内存使用
        memory_issues = self._check_memory_usage()
        issues.extend(memory_issues)
        
        # 检查持久化
        persistence_issues = self._check_persistence()
        issues.extend(persistence_issues)
        
        # 检查慢查询
        slow_query_issues = self._check_slow_queries()
        issues.extend(slow_query_issues)
        
        return issues
    
    def _check_connectivity(self):
        """检查连接性"""
        try:
            return self.client.ping()
        except Exception:
            return False
    
    def _check_memory_usage(self):
        """检查内存使用"""
        issues = []
        try:
            info = self.client.info('memory')
            used_memory = info.get('used_memory', 0)
            max_memory = info.get('maxmemory', 0)
            
            if max_memory > 0 and used_memory > max_memory * 0.9:
                issues.append("内存使用超过 90%，可能触发逐出策略")
            
            fragmentation = info.get('mem_fragmentation_ratio', 1)
            if fragmentation > 1.5:
                issues.append(f"内存碎片率过高: {fragmentation:.2f}")
                
        except Exception as e:
            issues.append(f"内存检查失败: {e}")
        
        return issues
    
    def _check_persistence(self):
        """检查持久化配置"""
        issues = []
        try:
            info = self.client.info('persistence')
            if info.get('rdb_last_bgsave_status') != 'ok':
                issues.append("最后一次 RDB 保存失败")
            if info.get('aof_last_bgrewrite_status') != 'ok':
                issues.append("最后一次 AOF 重写失败")
        except Exception as e:
            issues.append(f"持久化检查失败: {e}")
        
        return issues
    
    def _check_slow_queries(self):
        """检查慢查询"""
        issues = []
        try:
            slow_queries = self.client.slowlog_get(5)
            if len(slow_queries) >= 5:
                issues.append("检测到多个慢查询，请检查业务逻辑")
        except Exception as e:
            issues.append(f"慢查询检查失败: {e}")
        
        return issues

# 使用示例
troubleshooter = RedisTroubleshooter(redis_client)
issues = troubleshooter.diagnose_common_issues()
if issues:
    print("发现以下问题:")
    for issue in issues:
        print(f"- {issue}")
else:
    print("未发现明显问题")

实战案例

完整的电商应用示例

Python 复制代码

# filename: ecommerce_example.py
class ECommerceService:
    """电商服务综合示例"""
    
    def __init__(self, redis_client):
        self.r = redis_client
        self.cache = AdvancedCacheManager(redis_client)
        self.lock = lambda key: RobustDistributedLock(redis_client, key)
        self.order_queue = ReliableMessageQueue(redis_client, 'order_processing')
    
    @cache.cache_decorator(ttl=300, key_prefix="product")
    def get_product_details(self, product_id: int) -> dict:
        """获取商品详情（带缓存）"""
        # 模拟数据库查询
        time.sleep(0.05)
        return {
            "id": product_id,
            "name": f"Product {product_id}",
            "price": 99.99,
            "stock": 100
        }
    
    def place_order(self, user_id: int, product_id: int, quantity: int) -> str:
        """下单（使用分布式锁保护库存）"""
        lock_key = f"inventory_lock:{product_id}"
        
        with self.lock(lock_key):
            # 检查库存
            product = self.get_product_details(product_id)
            if product['stock'] < quantity:
                raise ValueError("库存不足")
            
            # 扣减库存
            # 这里应该是原子操作，简化示例
            new_stock = product['stock'] - quantity
            # 更新缓存和数据库...
            
            # 生成订单
            order_id = str(uuid.uuid4())
            order_data = {
                "order_id": order_id,
                "user_id": user_id,
                "product_id": product_id,
                "quantity": quantity,
                "total_price": product['price'] * quantity,
                "created_at": time.time()
            }
            
            # 发送到订单处理队列
            self.order_queue.enqueue(order_data, priority=5)
            
            # 失效相关缓存
            self.cache.invalidate_pattern(f"user_orders:{user_id}")
            
            return order_id
    
    def get_user_orders(self, user_id: int) -> list:
        """获取用户订单（带缓存）"""
        @self.cache.cache_decorator(ttl=600, key_prefix="user_orders")
        def _get_orders(user_id):
            # 模拟数据库查询
            time.sleep(0.1)
            return [{"order_id": str(uuid.uuid4()), "status": "completed"}]
        
        return _get_orders(user_id)

# 使用示例
def demo_ecommerce():
    """演示电商场景"""
    service = ECommerceService(redis_client)
    
    # 用户浏览商品（缓存加速）
    product = service.get_product_details(123)
    print(f"商品详情: {product}")
    
    # 用户下单（分布式锁保护）
    try:
        order_id = service.place_order(1001, 123, 2)
        print(f"下单成功: {order_id}")
    except ValueError as e:
        print(f"下单失败: {e}")
    
    # 查看订单（缓存加速）
    orders = service.get_user_orders(1001)
    print(f"用户订单: {orders}")

demo_ecommerce()

小结

至此，我们已经完成了 Redis × Python 的完整学习之旅。从最基础的环境搭建，到核心数据结构，再到高级特性和生产级架构，我们系统地掌握了 Redis 在现代应用开发中的方方面面。在下一个项目中，

尝试设计并实现一个完整的 Redis 使用方案，涵盖缓存、分布式协调和消息队列，并分享你的实践经验。感谢你跟随完成这个完整的学习系列。Redis 还有很多值得探索，但你已经拥有了坚实的基础和实战能力。

这是 Redis × Python（redis-py）系列的第六篇，也是最终篇。感谢阅读！