Apache SeaTunnel MCP Server:让AI成为你的ETL助手

Apache SeaTunnel MCP Server,可以将 SeaTunnel 的接口文档提供给 Cursor 等支持 AI 编程的 IDE,或其他支持 MCP 的 AI 工具。

MCP Server(Model Context Protocol Server) 是一种基于MCP协议的服务器,旨在为大型语言模型(LLM)提供与外部数据源和工具的无缝集成。它通过标准化AI系统与数据源的交互方式,帮助模型获取更丰富的上下文信息,从而生成更准确、更相关的响应。‌

SeaTunnel MCP Server 是连接AI编程工具与SeaTunnel的智能桥梁,有了 SeaTunnel MCP Server,开发者就可以通过 AI 助手完成以下工作:根据跟用户交互实现RESTful API V2的接口调用,至于通过这个接口文档数据能让 AI 干什么更多更强大的活,请发挥你和你们团队的想象力😜。

举个栗子🙋‍♀️🌰
  • ⚡ 一键提交/监控数据作业
  • 🔍 智能解析运行日志
  • 📊 自动生成运维报告
  • 🤖 根据自然语言生成配置文件

🚀 五分钟极速体验

🎯 如何使用

完成相关配置后,Apache SeaTunnel MCP Server 会自动获取 2.3.9 接口文档的数据并缓存在本地,AI 助手可以通过 MCP 读取接口文档数据。

你只要告诉 AI 你想要做什么即可,示例:

hocon 复制代码
env {
  job.mode = "batch"
}
 
source {
  Jdbc {
        url = "jdbc:hive2://***:10000/default"
        user = "hive"
        password = "******"
        driver = "org.apache.hive.jdbc.HiveDriver"
        connection_check_timeout_sec = 100
        query = "select * from table1 limit 100"
    }
}

transform {
}

sink {
    Jdbc {
        url = "jdbc:mysql://***:23306/?rewriteBatchedStatements=true"
        driver = "com.mysql.cj.jdbc.Driver"
        user = "root"
        password = "root"
        
        database = "test"
        table = "table1"
        # primary_keys = ["key1", "key2", ...]
        schema_save_mode = "CREATE_SCHEMA_WHEN_NOT_EXIST"
        data_save_mode="DROP_DATA"
        generate_sink_sql=true
    }
}
  • 帮我查一下 957461773944946690 的运行情况,注意这里的 957461773944946690 是上一步提交作业随机生成的jobId
  • 帮我查一下正在运行的作业有哪些?
  • 帮我查一下FINSHED的作业有哪些
  • 查看集群的运行情况
  • 帮我返回系统系统监控信息
  • 帮我把957461773944946690作业停掉

🚀 如何配置

前置条件

1.安装 Python 环境(版本号 >= 3.9,推荐最新的 LTS 版本)

2.安装Apache SeaTunnel (版本号>=2.3.9)

任意一个支持 MCP 的 IDE:

  • Cursor
  • VS Code + Cline 插件

安装:

bash 复制代码
# 下载源码
git clone https://github.com/ocean-zhc/seatunnel-mcp.git
# 进入目录(比如我的下载目录:/Users/ocean/Downloads/MCP/seatunnel-mcp)
cd seatunnel-mcp
# 安装
pip install -e .

配置:

这里的SEATUNNEL_API_URL是你部署好的UI地址,后面不要带 /

json 复制代码
{
    "mcpServers": {
        "seatunnel": {
            "command": "python",
            "args": [
                "-m",
                "src.seatunnel_mcp"
            ],
            "cwd": "/Users/ocean/Downloads/MCP/seatunnel-mcp",
            "env": {
                "SEATUNNEL_API_URL": "http://www.sjjc.seatunnel.dsj.com"
            }
        }
    }
}

配置完成之后,如下图:

❓帮助与支持

可前往issue进行提问:

Support MCP:https://github.com/apache/seatunnel/issues/9047

同时我们也成立了专项交流群,感兴趣的同学可以自行添加seatunnel1小助手加入!

Apache SeaTunnel

Apache SeaTunnel是一个云原生的高性能海量数据集成工具。北京时间 2023 年 6 月1 日,全球最大的开源软件基金会ApacheSoftware Foundation正式宣布Apache SeaTunnel毕业成为Apache顶级项目。目前,SeaTunnel在GitHub上Star数量已达8k+,社区达到6000+人规模。SeaTunnel支持在云数据库、本地数据源、SaaS、大模型等170多种数据源之间进行数据实时和批量同步,支持CDC、DDL变更、整库同步等功能,更是可以和大模型打通,让大模型链接企业内部的数据。

相关推荐
千宇宙航26 分钟前
闲庭信步使用SV搭建图像测试平台:第三十一课——基于神经网络的手写数字识别
图像处理·人工智能·深度学习·神经网络·计算机视觉·fpga开发
onceco1 小时前
领域LLM九讲——第5讲 为什么选择OpenManus而不是QwenAgent(附LLM免费api邀请码)
人工智能·python·深度学习·语言模型·自然语言处理·自动化
jndingxin4 小时前
OpenCV CUDA模块设备层-----高效地计算两个 uint 类型值的带权重平均值
人工智能·opencv·计算机视觉
Sweet锦4 小时前
零基础保姆级本地化部署文心大模型4.5开源系列
人工智能·语言模型·文心一言
hie988945 小时前
MATLAB锂离子电池伪二维(P2D)模型实现
人工智能·算法·matlab
晨同学03275 小时前
opencv的颜色通道问题 & rgb & bgr
人工智能·opencv·计算机视觉
蓝婷儿5 小时前
Python 机器学习核心入门与实战进阶 Day 3 - 决策树 & 随机森林模型实战
人工智能·python·机器学习
大千AI助手5 小时前
PageRank:互联网的马尔可夫链平衡态
人工智能·机器学习·贝叶斯·mc·pagerank·条件概率·马尔科夫链
小和尚同志5 小时前
Cline | Cline + Grok3 免费 AI 编程新体验
人工智能·aigc
我就是全世界6 小时前
TensorRT-LLM:大模型推理加速的核心技术与实践优势
人工智能·机器学习·性能优化·大模型·tensorrt-llm