Flink SQL 的 USE / USE CATALOG / USE MODULES(Catalog、Database、Module 三件套)

1、USE CATALOG:切换当前 Catalog

sql 复制代码
USE CATALOG cat1;

含义:把"当前 catalog"设置为 cat1

之后你写:

sql 复制代码
SHOW DATABASES;
CREATE TABLE t1 (...);

如果没有显式写 catalog.db.table 的全限定名,Flink 会默认把对象解析到 cat1 这个 catalog 里。

默认值default_catalog
不存在会怎样:直接抛异常(这点非常重要,很多人以为会自动创建)。

2、USE:切换当前 Database(可带 catalog 前缀)

sql 复制代码
USE db1;

含义:把当前 database 设置成 db1

之后你写 CREATE TABLE Orders (...),它会落在:
当前catalog.db1.Orders

也可以写全一点:

sql 复制代码
USE cat1.db1;

这相当于一次性把 catalog + database 都切到目标位置(具体支持程度以你环境对 catalog/database 的实现为准,但语义就是"按前缀解析")。

默认 databasedefault_database
db 不存在:抛异常。

3、USE MODULES:切换"函数/类型/规则"的解析顺序(非常实用,也非常容易忽略)

sql 复制代码
USE MODULES hive;

这句不是切 catalog/db,而是控制"元数据解析优先级"。它影响的典型对象包括:

  • 内置/扩展 函数(比如 hive 内置函数)
  • 用户自定义类型(UDT)
  • 规则、元数据解析(文档里统称 metadata)
3.1 什么是解析顺序?

当你执行:

sql 复制代码
SELECT my_func(x) FROM t;

Flink 会按 USE MODULES 声明的顺序去查找 my_func 到底来自哪个模块。

如果你启用了多个模块,还能指定优先级:

sql 复制代码
USE MODULES hive, core;

意思就是:优先在 hive 模块里找,找不到再去 core 里找。

3.2 "loaded" 与 "used"的区别(核心坑点)

文档含义是:

  • 模块被 load 后,默认是 used=true(可用)
  • 但一旦你执行 USE MODULES ...只有出现在列表里的模块会保持 used
    没出现在列表里的,即使已经 loaded,也会变成 disabled(used=false)

所以你会看到类似:

sql 复制代码
SHOW FULL MODULES;
-- hive true
-- core false

这就是为什么"我之前还能用的函数突然找不到了"的典型原因之一:你换了模块启用列表。

4、Java 里怎么用?(executeSql 返回 OK 的那种)

在 Java(TableEnvironment / StreamTableEnvironment)里,你直接:

java 复制代码
tEnv.executeSql("USE CATALOG cat1");
tEnv.executeSql("USE db1");
tEnv.executeSql("USE MODULES hive");

成功会返回 OK(或者对应的 TableResult 可打印),失败则抛异常。

建议你在平台化/脚本执行场景里,把每一次 USE 都当成"可能失败的边界",明确 catch 并记录上下文(当前 catalog/db/modules)。

5、一套推荐的"工程化用法"(避免环境漂移)

如果你在写作业/平台,强烈建议遵循这三条:

  1. 任何 DDL/DML 执行前,显式 USE CATALOG + USE db

    避免默认的 default_catalog.default_database 导致表建错位置。

  2. 模块切换要谨慎USE MODULES hive 会导致 core 被禁用(不在列表里)

    如果你依赖 core 的函数或规则,记得把它放进列表里:

    sql 复制代码
    USE MODULES hive, core;
  3. 对外提供 SQL 执行能力时 :建议每个会话隔离上下文

    因为 USE 改的是"会话级的当前上下文",很容易造成串环境问题。

6、总结

  • USE CATALOG xxx:切换当前 catalog(默认 default_catalog
  • USE dbUSE catalog.db:切换当前数据库(默认 default_database
  • USE MODULES ...:控制函数/类型/规则等元数据解析来源与优先级(默认模块 core
  • 三者组合决定:你不写全限定名时,SQL 到底解析到哪里、函数到底用哪个实现
相关推荐
Micro麦可乐11 小时前
Spring Boot 实战:从零设计一个短链系统(含完整代码与数据库设计)
数据库·spring boot·后端·哈希算法·雪花算法·短链系统
码农阿豪11 小时前
从零到一:Spring Boot快速接入金仓数据库实战
数据库·spring boot·后端
鼎讯信通12 小时前
风电光缆运维提质增效:G-4000A 光缆故障追踪仪破解风场巡检难题
运维·网络·数据库
三十..12 小时前
MySQL 从入门到高可用架构实战精要
运维·数据库·mysql
cfm_291413 小时前
Redis五大基本数据结构底层了解
数据结构·数据库·redis
真实的菜13 小时前
Redis 从入门到精通(十二):典型业务场景实战 —— 排行榜、限流器、秒杀系统、Session 共享
数据库·redis·python
你想考研啊13 小时前
mysql数据库导出导入
数据库·mysql·oracle
十年编程老舅14 小时前
Linux DRM:底层逻辑与实践架构
数据库·mysql
The Sheep 202315 小时前
Vue复习
linux·服务器·数据库
云边有个稻草人15 小时前
深度解析:KingbaseES高可用架构落地原理与生产运维实战
数据库·读写分离·数据库运维·金仓数据库·国产数据库技术·数据备份恢复