elasticsearch安装在服务器并进行向量检索

服务器安装elasticsearch

安装Elasticsearch的步骤通常包括以下几个阶段:

  1. 导入Elasticsearch公钥。

  2. 创建Elasticsearch仓库。

  3. 安装Elasticsearch。

  4. 启动Elasticsearch服务。

  5. 配置Elasticsearch开机自启。

以下是针对基于Debian/Ubuntu系统的安装示例:

1. 导入Elasticsearch公钥

wget -qO - https://artifacts.elastic.co/GPG-KEY-elasticsearch | sudo apt-key add -

2. 添加Elasticsearch源

echo "deb https://artifacts.elastic.co/packages/7.x/apt stable main" | sudo tee -a /etc/apt/sources.list.d/elastic-7.x.list

更新包信息

sudo apt-get update

3. 安装Elasticsearch

sudo apt-get install elasticsearch

4. 启动Elasticsearch服务

sudo systemctl start elasticsearch.service

5. 配置Elasticsearch开机自启

sudo systemctl enable elasticsearch.service

bash 复制代码
PUT my_vectors
{
  "mappings": {
    "properties": {
      "my_vector": {
        "type": "dense_vector",
        "dims": 5  // 设置向量的维度
      }
    }
  }
}

#添加文档:
POST my_vectors/_doc/
{
  "my_vector": [0.5, 1.5, 0.5, 0.5, 1.5]
}
 
POST my_vectors/_doc/
{
  "my_vector": [1.0, 1.0, 1.0, 1.0, 1.0]
}

#执行向量搜索:
GET my_vectors/_search
{
  "query": {
    "script_score": {
      "query": {
        "match_all": {}
      },
      "script": {
        "source": "cosineSimilarity(params.query_vector, 'my_vector') + 1.0",
        "params": {
          "query_vector": [0.5, 1.5, 0.5, 0.5, 1.5]
        }
      }
    }
  }
}

在这个例子中,首先创建了一个名为my_vectors的索引,并定义了一个名为my_vectordense_vector字段,用于存储5维向量。然后,向索引中添加了两个文档,每个文档包含一个向量。最后执行了一个向量搜索,使用余弦相似度(cosine similarity)来评估与查询向量的相似度。这个查询会返回所有文档的相似度得分。

相关推荐
武子康7 小时前
大数据-241 离线数仓 - 实战:电商核心交易数据模型与 MySQL 源表设计(订单/商品/品类/店铺/支付)
大数据·后端·mysql
IvanCodes7 小时前
一、消息队列理论基础与Kafka架构价值解析
大数据·后端·kafka
武子康1 天前
大数据-240 离线数仓 - 广告业务 Hive ADS 实战:DataX 将 HDFS 分区表导出到 MySQL
大数据·后端·apache hive
茶杯梦轩1 天前
从零起步学习RabbitMQ || 第二章:RabbitMQ 深入理解概念 Producer、Consumer、Exchange、Queue 与企业实战案例
服务器·后端·消息队列
洛森唛2 天前
ElasticSearch查询语句Query String详解:从入门到精通
后端·elasticsearch
字节跳动数据平台2 天前
5000 字技术向拆解 | 火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
武子康2 天前
大数据-239 离线数仓 - 广告业务实战:Flume 导入日志到 HDFS,并完成 Hive ODS/DWD 分层加载
大数据·后端·apache hive
洛森唛3 天前
Elasticsearch DSL 查询语法大全:从入门到精通
后端·elasticsearch
字节跳动数据平台3 天前
代码量减少 70%、GPU 利用率达 95%:火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
得物技术3 天前
深入剖析Spark UI界面:参数与界面详解|得物技术
大数据·后端·spark