Redis 与 AI:从缓存到智能搜索的融合之路
在当今数字化时代,Redis 不仅是一个高性能的缓存系统,更是一个强大的 AI 支持平台。Redis 通过其向量数据库功能和 AI 工具,为现代应用提供了独特的技术优势。
一、Redis 的 AI 能力
(一)向量数据库功能
Redis 的向量数据库功能是其 AI 能力的核心。它支持以下功能:
- 存储高维向量数据:Redis 可以存储向量及其相关的元数据,这些数据可以存储在哈希或 JSON 文档中。
- 执行相似性搜索:通过向量搜索(KNN 查询),Redis 可以快速找到与目标向量最相似的向量。
- 支持向量范围查询:允许用户基于向量距离进行范围查询。
- 元数据过滤功能:在执行向量搜索时,可以结合其他条件进行筛选,例如根据用户 ID 或类别过滤结果。
(二)RedisAI 模块
RedisAI 是 Redis 的一个模块,旨在将机器学习和深度学习带入 Redis 生态系统。它的主要特性包括:
- 张量存储:支持存储多维数组(张量),这些张量可以直接用作模型的输入或输出。
- 模型服务:支持加载和执行来自 TensorFlow、PyTorch 和 ONNX 的预训练模型。
- 脚本执行:通过 TorchScript 提供在 CPU 或 GPU 上执行预处理和后处理操作的能力。
- DAG 执行:允许定义和执行包含多个操作的有向无环图(DAG),实现复杂的推理管道。
- GPU 加速:支持 GPU 执行,充分利用硬件加速能力。
(三)Redis for AI
Redis for AI 是 Redis 提供的一套工具,旨在帮助开发者更高效地构建和部署 AI 应用。它包括:
- 向量数据库:提供世界上最快的向量数据库,支持高效的相似性搜索。
- 缓存解决方案:提供先进的缓存功能,减少对大型语言模型的依赖,降低成本并提升性能。
- 实时架构(RAG):支持基于检索增强生成(Retrieval Augmented Generation)的应用,提升智能体的推理能力和响应速度。
二、Redis 作为向量数据库的运行测试代码
(一)环境准备
-
安装 Redis Stack 使用 Docker 安装 Redis Stack:
bashdocker run -d --name redis-stack -p 6379:6379 redis/redis-stack:latest
-
准备数据 下面的代码展示了如何将数据存储到 Redis 中,并创建向量字段:
pythonimport redis import numpy as np from redis.commands.search.field import TextField, VectorField from redis.commands.search.indexDefinition import IndexDefinition, IndexType from redis.commands.search.query import Query from sentence_transformers import SentenceTransformer # 连接 Redis client = redis.Redis(host="localhost", port=6379, decode_responses=True) # 存储向量数据 keys = ["doc:1", "doc:2"] embeddings = np.array([[0.1, 0.2, 0.3], [0.4, 0.5, 0.6]], dtype=np.float32) for key, embedding in zip(keys, embeddings): client.hset(key, mapping={"embedding": embedding.tobytes()}) # 创建索引 schema = ( TextField("id", no_stem=True, as_name="id"), VectorField( "embedding", "FLAT", {"TYPE": "FLOAT32", "DIM": 3, "DISTANCE_METRIC": "L2"}, as_name="embedding", ), ) definition = IndexDefinition(prefix=["doc:"], index_type=IndexType.HASH) client.ft("idx:docs").create_index(fields=schema, definition=definition)
(二)向量搜索测试
以下代码展示了如何执行向量搜索:
python
# 查询向量
query_embedding = np.array([0.1, 0.2, 0.3], dtype=np.float32)
query = (
Query("(*)=>[KNN 2 @embedding $query_embedding AS score]")
.sort_by("score")
.return_fields("id", "score")
.dialect(2)
)
results = client.ft("idx:docs").search(query, query_params={"query_embedding": query_embedding.tobytes()})
for doc in results.docs:
print(doc)
三、Spring Boot 集成 Redis 向量数据库的代码案例
(一)环境准备
-
添加依赖 在
pom.xml
文件中添加以下依赖:xml<dependency> <groupId>org.springframework.ai</groupId> <artifactId>spring-ai-redis-store-spring-boot-starter</artifactId> </dependency>
-
配置 Redis 在
application.properties
文件中配置 Redis:propertiesspring.ai.vectorstore.redis.uri=redis://localhost:6379 spring.ai.vectorstore.redis.index=default-index spring.ai.vectorstore.redis.prefix=default:
(二)使用 Redis 向量数据库
以下代码展示了如何在 Spring Boot 应用程序中使用 Redis 向量数据库:
java
@Autowired
private VectorStore vectorStore;
@PostMapping("/embedding")
public ResultEntity<Boolean> embedding(@RequestParam MultipartFile file) throws Exception {
TikaDocumentReader tikaDocumentReader = new TikaDocumentReader(new InputStreamResource(file.getInputStream()));
List<Document> splitDocuments = new TokenTextSplitter().apply(tikaDocumentReader.read());
vectorStore.add(splitDocuments);
return ResultUtils.success(true);
}
@GetMapping("/query")
public List<Document> query(@RequestParam String query) {
return vectorStore.similaritySearch(query);
}
四、Redis 的 AI 应用场景
(一)实时数据缓存
Redis 的内存存储特性使其能够快速缓存 API 返回值,提高响应速度。例如,使用 LangChain 的 RedisCache
实现 LLM(大语言模型)的缓存功能:
java
set_llm_cache(RedisCache(redis_client));
(二)语义搜索与检索
Redis 的向量数据库功能可以用于语义搜索。例如,结合 LangChain 的 RedisVectorStore
,可以实现智能搜索功能:
java
vector_store = RedisVectorStore(redis_client);
(三)会话持久化
Redis 可以记录和检索会话历史,增强对话系统的持续性。例如,使用 LangGraph 的 langgraph-checkpoint-redis
,可以实现跨会话的持久化记忆。
五、总结
Redis 的 AI 能力和缓存功能的结合,为现代应用架构提供了强大的支持。通过合理配置和使用,可以在单一实例中同时满足缓存和向量搜索的需求,既节省了资源,又简化了系统架构。