Flink SQL 的 USE / USE CATALOG / USE MODULES(Catalog、Database、Module 三件套)

1、USE CATALOG:切换当前 Catalog

sql 复制代码
USE CATALOG cat1;

含义:把"当前 catalog"设置为 cat1

之后你写:

sql 复制代码
SHOW DATABASES;
CREATE TABLE t1 (...);

如果没有显式写 catalog.db.table 的全限定名,Flink 会默认把对象解析到 cat1 这个 catalog 里。

默认值default_catalog
不存在会怎样:直接抛异常(这点非常重要,很多人以为会自动创建)。

2、USE:切换当前 Database(可带 catalog 前缀)

sql 复制代码
USE db1;

含义:把当前 database 设置成 db1

之后你写 CREATE TABLE Orders (...),它会落在:
当前catalog.db1.Orders

也可以写全一点:

sql 复制代码
USE cat1.db1;

这相当于一次性把 catalog + database 都切到目标位置(具体支持程度以你环境对 catalog/database 的实现为准,但语义就是"按前缀解析")。

默认 databasedefault_database
db 不存在:抛异常。

3、USE MODULES:切换"函数/类型/规则"的解析顺序(非常实用,也非常容易忽略)

sql 复制代码
USE MODULES hive;

这句不是切 catalog/db,而是控制"元数据解析优先级"。它影响的典型对象包括:

  • 内置/扩展 函数(比如 hive 内置函数)
  • 用户自定义类型(UDT)
  • 规则、元数据解析(文档里统称 metadata)
3.1 什么是解析顺序?

当你执行:

sql 复制代码
SELECT my_func(x) FROM t;

Flink 会按 USE MODULES 声明的顺序去查找 my_func 到底来自哪个模块。

如果你启用了多个模块,还能指定优先级:

sql 复制代码
USE MODULES hive, core;

意思就是:优先在 hive 模块里找,找不到再去 core 里找。

3.2 "loaded" 与 "used"的区别(核心坑点)

文档含义是:

  • 模块被 load 后,默认是 used=true(可用)
  • 但一旦你执行 USE MODULES ...只有出现在列表里的模块会保持 used
    没出现在列表里的,即使已经 loaded,也会变成 disabled(used=false)

所以你会看到类似:

sql 复制代码
SHOW FULL MODULES;
-- hive true
-- core false

这就是为什么"我之前还能用的函数突然找不到了"的典型原因之一:你换了模块启用列表。

4、Java 里怎么用?(executeSql 返回 OK 的那种)

在 Java(TableEnvironment / StreamTableEnvironment)里,你直接:

java 复制代码
tEnv.executeSql("USE CATALOG cat1");
tEnv.executeSql("USE db1");
tEnv.executeSql("USE MODULES hive");

成功会返回 OK(或者对应的 TableResult 可打印),失败则抛异常。

建议你在平台化/脚本执行场景里,把每一次 USE 都当成"可能失败的边界",明确 catch 并记录上下文(当前 catalog/db/modules)。

5、一套推荐的"工程化用法"(避免环境漂移)

如果你在写作业/平台,强烈建议遵循这三条:

  1. 任何 DDL/DML 执行前,显式 USE CATALOG + USE db

    避免默认的 default_catalog.default_database 导致表建错位置。

  2. 模块切换要谨慎USE MODULES hive 会导致 core 被禁用(不在列表里)

    如果你依赖 core 的函数或规则,记得把它放进列表里:

    sql 复制代码
    USE MODULES hive, core;
  3. 对外提供 SQL 执行能力时 :建议每个会话隔离上下文

    因为 USE 改的是"会话级的当前上下文",很容易造成串环境问题。

6、总结

  • USE CATALOG xxx:切换当前 catalog(默认 default_catalog
  • USE dbUSE catalog.db:切换当前数据库(默认 default_database
  • USE MODULES ...:控制函数/类型/规则等元数据解析来源与优先级(默认模块 core
  • 三者组合决定:你不写全限定名时,SQL 到底解析到哪里、函数到底用哪个实现
相关推荐
zandy10112 小时前
从ChatBI到自主决策:Agentic BI的演进路径与核心厂商图谱
数据库·chatbi·agentic bi
MoonBit月兔3 小时前
海外开发者实践分享:用 MoonBit 开发 SQLC 插件(其二)
开发语言·javascript·数据库·redis·mysql·moonbit
scan7243 小时前
python mcp see
开发语言·数据库·python
Coder_Boy_3 小时前
前端和后端软件系统联调经典问题汇总(二)
开发语言·数据库·python
程序员根根3 小时前
MySQL 核心知识全解析:从语法到实战(DDL/DML/DQL + 核心特性)
数据库·mysql
P-surp3 小时前
mysql 数据库 批量库 迁移、恢复
数据库·mysql
繁星星繁3 小时前
【Mysql】数据库的操作
数据库·mysql·oracle
Apex Predator3 小时前
【无标题】
sql
dvlinker3 小时前
动态代理技术实战测评—高效解锁Zillow房价历史
android·java·数据库