elasticsearch安装在服务器并进行向量检索

服务器安装elasticsearch

安装Elasticsearch的步骤通常包括以下几个阶段:

  1. 导入Elasticsearch公钥。

  2. 创建Elasticsearch仓库。

  3. 安装Elasticsearch。

  4. 启动Elasticsearch服务。

  5. 配置Elasticsearch开机自启。

以下是针对基于Debian/Ubuntu系统的安装示例:

1. 导入Elasticsearch公钥

wget -qO - https://artifacts.elastic.co/GPG-KEY-elasticsearch | sudo apt-key add -

2. 添加Elasticsearch源

echo "deb https://artifacts.elastic.co/packages/7.x/apt stable main" | sudo tee -a /etc/apt/sources.list.d/elastic-7.x.list

更新包信息

sudo apt-get update

3. 安装Elasticsearch

sudo apt-get install elasticsearch

4. 启动Elasticsearch服务

sudo systemctl start elasticsearch.service

5. 配置Elasticsearch开机自启

sudo systemctl enable elasticsearch.service

bash 复制代码
PUT my_vectors
{
  "mappings": {
    "properties": {
      "my_vector": {
        "type": "dense_vector",
        "dims": 5  // 设置向量的维度
      }
    }
  }
}

#添加文档:
POST my_vectors/_doc/
{
  "my_vector": [0.5, 1.5, 0.5, 0.5, 1.5]
}
 
POST my_vectors/_doc/
{
  "my_vector": [1.0, 1.0, 1.0, 1.0, 1.0]
}

#执行向量搜索:
GET my_vectors/_search
{
  "query": {
    "script_score": {
      "query": {
        "match_all": {}
      },
      "script": {
        "source": "cosineSimilarity(params.query_vector, 'my_vector') + 1.0",
        "params": {
          "query_vector": [0.5, 1.5, 0.5, 0.5, 1.5]
        }
      }
    }
  }
}

在这个例子中,首先创建了一个名为my_vectors的索引,并定义了一个名为my_vectordense_vector字段,用于存储5维向量。然后,向索引中添加了两个文档,每个文档包含一个向量。最后执行了一个向量搜索,使用余弦相似度(cosine similarity)来评估与查询向量的相似度。这个查询会返回所有文档的相似度得分。

相关推荐
武子康41 分钟前
大数据-244 离线数仓 - Hive ODS 层建表与分区加载实战(DataX→HDFS→Hive)
大数据·后端·apache hive
Elasticsearch1 天前
为上下文工程构建高效的数据库检索工具
elasticsearch
武子康1 天前
大数据-243 离线数仓 - 实战电商核心交易增量导入(DataX - HDFS - Hive 分区
大数据·后端·apache hive
代码匠心3 天前
从零开始学Flink:Flink SQL四大Join解析
大数据·flink·flink sql·大数据处理
武子康4 天前
大数据-242 离线数仓 - DataX 实战:MySQL 全量/增量导入 HDFS + Hive 分区(离线数仓 ODS
大数据·后端·apache hive
Elasticsearch4 天前
需要知道某个同义词是否实际匹配了你的 Elasticsearch 查询吗?
elasticsearch
SelectDB5 天前
易车 × Apache Doris:构建湖仓一体新架构,加速 AI 业务融合实践
大数据·agent·mcp
武子康5 天前
大数据-241 离线数仓 - 实战:电商核心交易数据模型与 MySQL 源表设计(订单/商品/品类/店铺/支付)
大数据·后端·mysql
IvanCodes5 天前
一、消息队列理论基础与Kafka架构价值解析
大数据·后端·kafka
武子康6 天前
大数据-240 离线数仓 - 广告业务 Hive ADS 实战:DataX 将 HDFS 分区表导出到 MySQL
大数据·后端·apache hive