测试es向量检索

#需要注意该版本部分功能(rrf)收费,可申请30天试用

#测试阶段可以修改dims参数来测试

#拉取镜像

bash 复制代码
docker pull docker.elastic.co/elasticsearch/elasticsearch:8.11.1

#启动命令

bash 复制代码
docker run -d --name elasticsearch \
  -p 9200:9200 -p 9300:9300 \
  -e "discovery.type=single-node" \
  -e "xpack.security.enabled=false" \
  docker.elastic.co/elasticsearch/elasticsearch:8.11.1

#创建索引

java 复制代码
PUT my_vector_index
{
  "mappings": {
    "properties": {
      "title": { // 存储原始文本
        "type": "text"
      },
      "title_vector": { // 存储对应的向量
        "type": "dense_vector",
        "dims": 384, // 必须与你生成的向量维度一致
        "index": true, // 启用 ANN 索引
        "similarity": "cosine" // 使用余弦相似度
      }
    }
  }
}

#写入文档

java 复制代码
POST my_vector_index/_doc
{
  "title": "The quick brown fox jumps over the lazy dog",
  "title_vector": [0.125, -0.056, 0.987, ...] // 这里替换为真实的 384 维向量
}

#进行向量搜索

java 复制代码
GET my_vector_index/_search
{
  "knn": {
    "field": "title_vector", // 指定向量字段
    "query_vector": [0.125, -0.056, 0.987, ...], // 将你的查询词(如 "animal")也转换为向量
    "k": 10, // 返回最相似的 10 个结果
    "num_candidates": 100 // 从每个分片中选取的候选数量,越大越准但越慢
  }
}

#将向量搜索和传统搜索结合

java 复制代码
GET my_vector_index/_search
{
  "query": {
    "match": {
      "title": "quick fox" // 传统关键词查询
    }
  },
  "knn": {
    "field": "title_vector",
    "query_vector": [-0.123, 0.045, 0.888, ...], // 语义查询
    "k": 10,
    "num_candidates": 100
  },
  "rank": {
    "rrf": { // 使用 Reciprocal Rank Fusion 算法合并两次搜索的结果
      "window_size": 50,
      "rank_constant": 20
    }
  }
}

#申请rrf免费30天体验

java 复制代码
POST /_license/start_trial?acknowledge=true
相关推荐
大树8810 小时前
金刚石散热越强,管路越先见顶
大数据·运维·服务器·人工智能·ai
大志哥12311 小时前
ES和Logstash日志链路系统上线后遭遇切片爆炸(解决)
大数据·elasticsearch
果丁智能12 小时前
物联网智能锁赋能集中式住宿:身份核验与远程权限管控的全链路技术实践
大数据·人工智能·物联网·智能家居
ApacheSeaTunnel13 小时前
实战演示 | 基于 Apache SeaTunnel 与 Apache DolphinScheduler 实现 MySQL 到 Doris 离线定时增量同步
大数据·mysql·开源·doris·数据集成·seatunnel·数据同步
weixin_3975740913 小时前
PDF复杂表格的1:1还原引擎:跨页表格自动拼接技术实战
大数据·人工智能·pdf
TableRow13 小时前
参数化搜索的实现原理:从多维索引到查询优化
elasticsearch·全文检索
极光代码工作室13 小时前
基于数据仓库的电商数据分析平台
大数据·hadoop·python·spark·数据可视化
秋名山码民14 小时前
Graph RAG 深度解析:从向量检索到知识推理的技术演进
大数据·人工智能·rag
m0_3801671414 小时前
面向开发者的Top10加密货币数据API(2026年最新)
大数据·人工智能·区块链
yyxx41212314 小时前
上海企业如何选择专业的钉钉服务商
java·大数据·人工智能·钉钉