Logstash同步ES索引数据

Logstash同步ES索引数据

一,软件下载地址

https://www.elastic.co/cn/downloads/past-releases#logstash-oss

建议使用版本和elasticsearch版本一致,本次教程使用7.9.3版本

二、安装配置

bash 复制代码
tar -zxvf  logstash-oss-7.9.3.tar.gz
cd logstash-7.9.3/config
cp logstash-sample.conf logstash.conf

配置文件 logstash.conf 内容:

bash 复制代码
input{
    elasticsearch{
        # 源端地址
        hosts =>  ["172.16.7.77:9200","172.16.7.78:9200","172.16.7.79:9200"]
        # 安全集群配置登录用户名密码
         user => "admin"
         password => "12345678"
        # 需要迁移的索引列表,以逗号分隔,基于机器实际信息填写,-.*表示排除.开始的索引。
        # index =>"know_info,share_info,test_01,logistics_keyword,notice,ask_info,shop_v2,pinyin2,jjkl_company,cmm_resources_info,user_test,demo,employment,auth_log,machine_info,look,down_num,stars,notice_project,nginx_access_log"
        index => "nginx_access_log"
        # 以下三项保持默认即可,包含线程数和迁移数据大小和logstash jvm配置相关
        docinfo=>true
        # 默认不变,如果需要增加迁移速度可以适当调高以下两个参数,但是需要保证机器配置
        slices => 3
        size => 3000
        # 使用https配置,华为云需要指定ca_file ,文件在控制台下载自行上传
        # SSL默认为false
        ssl => true
        ca_file => "/opt/es/logstash-7.9.3/CloudSearchService-dev.cer"
    }
}

filter {
  # 去掉一些logstash自己加的字段
  mutate {
    remove_field => ["@timestamp", "@version"]
  }
}

output{
    elasticsearch{
        # 目的端es地址
        hosts => ["172.16.10.66:9200"]
        # 目的端索引名称,以下配置为和源端保持一致
	    user => "elastic"
        password => "123456789"
        index => "%{[@metadata][_index]}"
        # 目的端索引type,以下配置为和源端保持一致
        # document_type => "%{[@metadata][_type]}"
        # 目标端数据的_id,如果不需要保留原_id,可以删除以下这行,删除后性能会更好
        document_id => "%{[@metadata][_id]}"
        ilm_enabled => false
        manage_template => false
        # inptu和output的证书写法不一样
        # cacert => "/opt/logstash-7.9.3/config/CloudSearchService.cer"
    }
}

校验配置文件:bin/logstash -f config/logstash.conf -t

启动:bin/logstash -f config/logstash.conf

相关推荐
Elasticsearch2 天前
如何使用 Agent Builder 排查 Kubernetes Pod 重启和 OOMKilled 事件
elasticsearch
Elasticsearch3 天前
通用表达式语言 ( CEL ): CEL 输入如何改进 Elastic Agent 集成中的数据收集
elasticsearch
武子康3 天前
大数据-236 离线数仓 - 会员指标验证、DataX 导出与广告业务 ODS/DWD/ADS 全流程
大数据·后端·apache hive
武子康4 天前
大数据-235 离线数仓 - 实战:Flume+HDFS+Hive 搭建 ODS/DWD/DWS/ADS 会员分析链路
大数据·后端·apache hive
DianSan_ERP5 天前
电商API接口全链路监控:构建坚不可摧的线上运维防线
大数据·运维·网络·人工智能·git·servlet
够快云库5 天前
能源行业非结构化数据治理实战:从数据沼泽到智能资产
大数据·人工智能·机器学习·企业文件安全
AI周红伟5 天前
周红伟:智能体全栈构建实操:OpenClaw部署+Agent Skills+Seedance+RAG从入门到实战
大数据·人工智能·大模型·智能体
B站计算机毕业设计超人5 天前
计算机毕业设计Django+Vue.js高考推荐系统 高考可视化 大数据毕业设计(源码+LW文档+PPT+详细讲解)
大数据·vue.js·hadoop·django·毕业设计·课程设计·推荐算法
计算机程序猿学长5 天前
大数据毕业设计-基于django的音乐网站数据分析管理系统的设计与实现(源码+LW+部署文档+全bao+远程调试+代码讲解等)
大数据·django·课程设计
B站计算机毕业设计超人5 天前
计算机毕业设计Django+Vue.js音乐推荐系统 音乐可视化 大数据毕业设计 (源码+文档+PPT+讲解)
大数据·vue.js·hadoop·python·spark·django·课程设计