SpringAI版本更新:向量数据库不可用的解决方案!

Spring AI 前两天(4.10 日)更新了 1.0.0-M7 版本后,原来的 SimpleVectorStore 内存级别的向量数据库就不能用了,Spring AI 将其全部源码删除了。

此时我们就需要一种成本更低的解决方案来解决这个问题,如何解决呢?我们一起来看。

解决方案:Redis 向量数据库

虽然 SimpleVectorStore 不支持了,但 Spring AI 内置了 Redis 或 ES 作为向量数据库的分布式存储中间件,我们可以用他们来进行向量的存储。

而在这两种方案中,显然 Redis 使用成本更低,因此,我们来看如何将向量存储到 Redis 数据库中。

它的具体实现步骤如下。

安装Redis-Stack

  1. 下载 Docker Hubwww.docker.com/get-started...
  2. 安装 redis-stack-server:使用"docker run -d --name redis-stack-server -p 6379:6379 redis/redis-stack-server"。

添加依赖

我们使用阿里云百炼平台的嵌入模型 text-embedding-v3 是兼容 OpenAI 的 SDK 的,因此,我们需要添加 OpenAI 和 Redis Vector 依赖:

xml 复制代码
<dependency>
  <groupId>org.springframework.ai</groupId>
  <artifactId>spring-ai-starter-vector-store-redis</artifactId>
</dependency>

<dependency>
  <groupId>org.springframework.ai</groupId>
  <artifactId>spring-ai-starter-model-openai</artifactId>
</dependency>

设置配置信息

配置 Redis 连接信息,以及嵌入模型的配置信息:

yaml 复制代码
spring:
  data:
    redis:
      host: localhost
      port: 6379
  ai:
    vectorstore:
      redis:
        initialize-schema: true
        index-name: custom-index
        prefix: custom-prefix
    openai:
      api-key: ${ALIYUN-AK}
      embedding:
        options:
          model: text-embedding-v3

阿里云百炼平台支持的向量模型:

代码实现

Redis 添加向量数据

java 复制代码
@Autowired
private VectorStore vectorStore;

// 构建数据
List<Document> documents =
List.of(new Document("I like Spring Boot"),
        new Document("I love Java"));
// 添加到向量数据库
vectorStore.add(documents);

当然,向量数据的数据源可以是文件、图片、音频等资源,这里为了简单演示整体执行流程,使用了更简单直观的文本作为数据源。

VectorStore 提供的常用方法如下:

  • add(List documents) :添加文档。
  • delete(List idList) :按 ID 删除文档。
  • delete(Filter.Expression filterExpression) :按过滤表达式删除文档。
  • similaritySearch(String query) 和 similaritySearch(SearchRequest request) :相似性搜索。

执行结果如下:

查询向量数据

java 复制代码
@RestController
@RequestMapping("/vector")
public class VectorController {

    @Resource
    private VectorStore vectorStore;

    @RequestMapping("/find")
    public List find(@RequestParam String query) {
        // 构建搜索请求,设置查询文本和返回的文档数量
        SearchRequest request = SearchRequest.builder()
        .query(query)
        .topK(3)
        .build();
        List<Document> result = vectorStore.similaritySearch(request);
        System.out.println(result);
        return result;
    }
}

执行结果如下:

从上述结果可以看出,和"java"相似度最高的向量为"I love Java",相似度评分为 0.77,如果我们 SearchRequest 对象中的 topK 设置为 1 的话,只会查询"I love Java"这条数据,如下图所示:

本文已收录到我的技术小站 www.javacn.site,其中包含的内容有:Spring AI、并发编程、MySQL、Redis、Spring、Spring MVC、Spring Boot、Spring Cloud、MyBatis、JVM、设计模式、消息队列、场景题等模块。

相关推荐
qq_436962181 分钟前
数据中台:打破企业数据孤岛,实现全域资产化的关键一步
数据库·人工智能·信息可视化·数据挖掘·数据分析
宇若-凉凉26 分钟前
BERT 完整教程指南
人工智能·深度学习·bert
lkbhua莱克瓦241 小时前
Java基础——方法
java·开发语言·笔记·github·学习方法
JD技术委员会1 小时前
如何在跨部门沟通失误后进行协调与澄清
人工智能
PcVue China1 小时前
PcVue X 工控——工厂数字化转型与落地巡回研讨会圆满举行
人工智能·软件工程·scada·监控平台·工控网
q***71851 小时前
海康威视摄像头ISUP(原EHOME协议) 摄像头实时预览springboot 版本java实现,并可以在浏览器vue前端播放(附带源码)
java·前端·spring boot
_Jimmy_1 小时前
JUC包里的同步组件主要实现了AQS的哪些主要方法
java
范纹杉想快点毕业2 小时前
《嵌入式开发硬核指南:91问一次讲透底层到架构》
java·开发语言·数据库·单片机·嵌入式硬件·mongodb
勇哥java实战分享2 小时前
第一次用 Ollama 跑视觉模型:Qwen2.5-VL 7B 给了我一个意外惊喜
后端
StarPrayers.2 小时前
自蒸馏学习方法
人工智能·算法·学习方法