Elasticsearch 向量数据库本地部署 及操作方法

elasticsearch是个分布式向量数据库,支持多种查找模式。此外还拥有 Metadata、Filtering、Hybrid Search、Delete、Store Documents、Async等能力。本文仅是记录本地测试途中遇到的问题。

一,环境部署

下载软件

首先去官网,选择适合平台下载

https://www.elastic.co/downloads/elasticsearch

启动配置

解压后找到config目录下的elasticsearch.yml

找到98行将这里改为false,否则我们无法在浏览器中正常访问

然后找到32、37行设置数据和记录的存储位置

找到92行设为false,否则会提示安全错误

设置后保存即可

启动数据库

回到上层,进入bin目录,找到bat可执行文件双击后等待,

随后弹出控制台,若无报错信息便是启动成功了

完成启动后用浏览器访问localhost:9200 或127.0.0.1:9200,如果看到如下信息就算可以成功访问了

二,操作数据库(浏览器api)

可以直接通过http api、postman来操作es数据库。

创建索引
模式:PUT 
参数:/products(索引名 )
数据:
{
  "settings": {
    "number_of_shards": 1, (主分片的数量)
    "number_of_replicas": 0 (副本分片的数量)
  }
}
添加文档
模式:POST
参数: /products/_doc/1(指定文档id 1,如果不写doc 1 那么就会自动生成id)
{
  "title":"天气",
  "content":"晴天霹雳"
}
查询文档
模式:GET
参数:/products/_doc/1(指定文档id)
更新文档

es中更新文档是先删除再添加

模式:PUT
参数:/products/_doc/1(指定文档id)
删除文档
模式:DELETE
参数:/products/_doc/1(指定文档id)

三,操作数据库(Python)

安装Elasticsearch

pip install Elasticsearch

初始化
python 复制代码
from flask import Flask, request, jsonify
from elasticsearch import Elasticsearch
#链接目标数据库
es = Elasticsearch(hosts="localhost:9200") 
创建索引
python 复制代码
es.indices.create(index='游戏攻略', body={}) 
向索引插入文档
python 复制代码
		doc = {
            'title':title,
            'content':content
        }
    
        es.index(index='游戏攻略', body=doc)
查找索引
python 复制代码
		query = {
            'query': {
                'match': {
                    # 'title': title,
                    'content': content
                }
                # "match_all": {}
            }
        }
        result = self.es.search(index=indexName, body=query)
        # print(result)
        if result['_shards']['total'] > 0:
            print('找到相关数据')
删除索引
python 复制代码
es.indices.delete(index=index)

四,问题解决

  1. 如果出现"method is deprecated. Use 'Elasticsearch.options()' instead"

    第一种方法:将创建索引的方式改为es.indices.create(index='身份介绍2', body=doc) x这种形式就行了

    第二种方法:版本降级 pip install elasticsearch==7.13.0

  2. 如果在浏览器测试时出现下面这个框,或提示"security_exception",就把elasticserch.yaml 的xpack.security.enabled设为 false

  3. 如果提示"Could not rename log file 'logs/gc.log' to 'logs/gc.log.20' (Permission denied)."

    4.python 安装

    pip install llama-index-vector-stores-elasticsearch

    pip install elasticsearch

相关推荐
青云交6 分钟前
大数据新视界 -- 大数据大厂之 Impala 性能优化:跨数据中心环境下的挑战与对策(上)(27 / 30)
大数据·性能优化·impala·案例分析·代码示例·跨数据中心·挑战对策
soso196842 分钟前
DataWorks快速入门
大数据·数据仓库·信息可视化
The_Ticker1 小时前
CFD平台如何接入实时行情源
java·大数据·数据库·人工智能·算法·区块链·软件工程
java1234_小锋1 小时前
Elasticsearch中的节点(比如共20个),其中的10个选了一个master,另外10个选了另一个master,怎么办?
大数据·elasticsearch·jenkins
Elastic 中国社区官方博客1 小时前
Elasticsearch 开放推理 API 增加了对 IBM watsonx.ai Slate 嵌入模型的支持
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
我的运维人生1 小时前
Elasticsearch实战应用:构建高效搜索与分析平台
大数据·elasticsearch·jenkins·运维开发·技术共享
企鹅侠客1 小时前
ETCD调优
数据库·etcd
Json_181790144801 小时前
电商拍立淘按图搜索API接口系列,文档说明参考
前端·数据库
大数据编程之光1 小时前
Flink Standalone集群模式安装部署全攻略
java·大数据·开发语言·面试·flink
B站计算机毕业设计超人1 小时前
计算机毕业设计SparkStreaming+Kafka旅游推荐系统 旅游景点客流量预测 旅游可视化 旅游大数据 Hive数据仓库 机器学习 深度学习
大数据·数据仓库·hadoop·python·kafka·课程设计·数据可视化