目录
-
-
- 一、前言
-
- 1️⃣钉钉(DingTalk)
- 2️⃣OpenClaw
- 3️⃣OpenMetadata
- [4️⃣MCP(Model Context Protocol)](#4️⃣MCP(Model Context Protocol))
- 二、安装OpenClaw
- 三、配置OpenClaw钉钉机器人
- [四、调用OpenMetadata MCP](#四、调用OpenMetadata MCP)
-
一、前言

先介绍下这四个工具/协议的定位与核心能力,本文将从零开始配置。
1️⃣钉钉(DingTalk)
阿里巴巴旗下的企业协作平台,2014年上线,是中国市场份额最大的企业即时通讯与办公套件之一。
核心能力包括:即时消息与视频会议、考勤打卡与审批流、企业通讯录、低代码应用搭建(宜搭)、以及近年来整合的 AI 助理功能。它更像一个"企业操作系统",把 HR、OA、协同文档、客户管理等功能整合在一个 App 里,主要面向中大型企业的内部运营。
2️⃣OpenClaw
OpenClaw 是一个开源、可自托管的个人 AI Agent 平台。可运行在你自己的笔记本上,连接你已有的聊天渠道(钉钉、飞书等平台)。
它不仅能聊天 ,更能执行任务:读写文件、处理邮件、运行代码、控制浏览器、调度工作流。
详见:https://zhuanlan.zhihu.com/p/2015027745743189513
3️⃣OpenMetadata
开源的统一元数据管理平台(类似 DataHub、Amundsen),专注解决企业数据治理的痛点。
它提供:数据资产目录(知道你有哪些表、API、仪表盘)、数据血缘追踪(知道数据从哪来、流向哪)、数据质量监控、数据所有权与标签管理,以及协作功能(让数据工程师和业务人员共同维护元数据)。目标是让企业真正"知道自己的数据",降低数据孤岛和治理混乱的风险。
4️⃣MCP(Model Context Protocol)
由 Anthropic 在 2024 年底提出并开源的标准协议,定义了 LLM(如 Claude)如何与外部工具、数据源进行标准化通信。
可以类比为 AI 领域的"USB-C"------在此之前,每个 AI 应用和工具的集成方式各自为政;MCP 提供了统一的接口规范,让 LLM 能以一致的方式调用文件系统、数据库、API、第三方服务等资源。开发者只需实现一次 MCP Server,就能被任何支持 MCP 的客户端(如 Claude、Cursor)调用,大幅降低集成成本。
二、安装OpenClaw
详见官方文档:https://docs.openclaw.ai/zh-CN/install
macOS/Linux 执行安装命令,更新也可执行此命令
bash
curl -fsSL https://openclaw.ai/install.sh | bash
Windows 执行安装命令
bash
iwr -useb https://openclaw.ai/install.ps1 | iex
模型可以选Qwen,有免费额度,其它下一步就行,空格勾选,Enter下一步
安装后可以验证下
bash
openclaw doctor # 检查配置问题
openclaw status # Gateway 网关状态
openclaw dashboard # 打开浏览器 UI
三、配置OpenClaw钉钉机器人
详见官方文档:https://open.dingtalk.com/document/dingstart/install-openclaw-locally
1️⃣安装钉钉插件
bash
openclaw plugins install @dingtalk-real-ai/dingtalk-connector
2️⃣在 OpenClaw 中添加钉钉配置
通过终端应用,在终端中输入执行 vim ~/.openclaw/openclaw.json 进入文件编辑:
bash
{
"channels": {
"dingtalk-connector": {
"clientId": "钉钉应用的Client Secret", // 必选:填入上方的 钉钉 Client ID
"clientSecret": "钉钉应用的Client Secret", // 必选:填入上方的 Client Secret
"gatewayToken": "Gateway 认证 token", // 必选:Gateway 认证 token, openclaw.json配置中 gateway.auth.token 的值
"gatewayPassword": "", // 可选:Gateway 认证 password(与 token 二选一)
"sessionTimeout": 1800000 // 可选:会话超时(ms),默认 30 分钟
}
},
"gateway": { // gateway通常是已有的节点,配置时注意把http部分追加到已有节点下
"auth": {
"mode": "token",
"token": "Gateway 认证 token" // 必选:一般是安装时默认就有
},
"http": {
"endpoints": {
"chatCompletions": {
"enabled": true // 必选
}
}
}
}
}
clientId和clientSecret见 https://alidocs.dingtalk.com/i/nodes/kDnRL6jAJMdn7BG2TwPE6LP0VyMoPYe1
钉钉机器人发布后,钉钉上搜索你创建的机器人。

语音也可以

四、调用OpenMetadata MCP
设置中获取OpenMetadata JWT 令牌,在Bots/McpApplicationBot
把MCP接口地址和令牌给龙虾,直接让连接即可

bash
 OpenMetadata MCP 接口列表
1. search_metadata - 搜索元数据
功能: 在 OpenMetadata 目录中搜索数据资产和业务术语 支持搜索: 表、仪表板、主题、管道等元数据实体 关键参数:
query - 自然语言搜索查询
entityType - 按实体类型过滤
queryFilter - 高级 OpenSearch JSON 查询
size - 返回结果数量(最大50)
fields - 额外字段(如列信息、查询等)
2. get_entity_details - 获取实体详情
功能: 获取特定实体的详细信息 参数:
entityType - 实体类型
fqn - 完全限定名称
3. get_entity_lineage - 获取血缘关系
功能: 获取实体的上下游依赖关系 用途: 根因分析(上游)或影响分析(下游) 参数:
entityType - 实体类型
fqn - 完全限定名称
upstreamDepth - 上游遍历深度(默认3,最大10)
downstreamDepth - 下游遍历深度(默认3,最大10)
4. create_glossary_term - 创建术语表术语
功能: 创建新的术语表术语 要求: 术语必须属于某个术语表 参数:
glossary - 术语表完全限定名称
parentTerm - 父术语(可选)
name - 术语名称
description - 术语描述
owners - 所有者列表
5. create_glossary - 创建术语表
功能: 创建新的术语表 参数:
name - 术语表名称
description - 术语表描述
owners - 所有者列表
reviewers - 评审者列表
mutuallyExclusive - 术语是否互斥
6. patch_entity - 修补实体
功能: 基于 JSONPatch 修补实体 参数:
entityType - 实体类型
fqn - 完全限定名称
patch - JSONPatch 字符串
 接口分类
查询类接口
search_metadata - 搜索
get_entity_details - 详情
get_entity_lineage - 血缘
创建类接口
create_glossary - 创建术语表
create_glossary_term - 创建术语
更新类接口
patch_entity - 修补实体
 使用场景
数据发现
search_metadata - 查找表、仪表板等
get_entity_details - 查看表结构、描述等
数据血缘分析
get_entity_lineage - 分析数据流向和依赖
数据治理
create_glossary - 创建业务术语表
create_glossary_term - 定义业务术语
patch_entity - 更新元数据信息
 注意事项
搜索限制:size 参数最大为50,需要分页时使用 from 参数
血缘深度: 上游/下游深度最大为10,防止响应过大
术语表: 创建术语前需要先创建或选择术语表
权限: 需要有效的 Bearer Token 认证

下面的操作有点吓人了,感觉真要被AI替代了!!!
我让统计一个提单量,本意是让它输出计算的SQL,它直接输出了统计报告,而且自动下载了pg客户端,还破解了数据库密码,自动执行。

家人们,我们失业了干啥呢😭