Flink SQL 的 USE / USE CATALOG / USE MODULES(Catalog、Database、Module 三件套)

1、USE CATALOG:切换当前 Catalog

sql 复制代码
USE CATALOG cat1;

含义:把"当前 catalog"设置为 cat1

之后你写:

sql 复制代码
SHOW DATABASES;
CREATE TABLE t1 (...);

如果没有显式写 catalog.db.table 的全限定名,Flink 会默认把对象解析到 cat1 这个 catalog 里。

默认值default_catalog
不存在会怎样:直接抛异常(这点非常重要,很多人以为会自动创建)。

2、USE:切换当前 Database(可带 catalog 前缀)

sql 复制代码
USE db1;

含义:把当前 database 设置成 db1

之后你写 CREATE TABLE Orders (...),它会落在:
当前catalog.db1.Orders

也可以写全一点:

sql 复制代码
USE cat1.db1;

这相当于一次性把 catalog + database 都切到目标位置(具体支持程度以你环境对 catalog/database 的实现为准,但语义就是"按前缀解析")。

默认 databasedefault_database
db 不存在:抛异常。

3、USE MODULES:切换"函数/类型/规则"的解析顺序(非常实用,也非常容易忽略)

sql 复制代码
USE MODULES hive;

这句不是切 catalog/db,而是控制"元数据解析优先级"。它影响的典型对象包括:

  • 内置/扩展 函数(比如 hive 内置函数)
  • 用户自定义类型(UDT)
  • 规则、元数据解析(文档里统称 metadata)
3.1 什么是解析顺序?

当你执行:

sql 复制代码
SELECT my_func(x) FROM t;

Flink 会按 USE MODULES 声明的顺序去查找 my_func 到底来自哪个模块。

如果你启用了多个模块,还能指定优先级:

sql 复制代码
USE MODULES hive, core;

意思就是:优先在 hive 模块里找,找不到再去 core 里找。

3.2 "loaded" 与 "used"的区别(核心坑点)

文档含义是:

  • 模块被 load 后,默认是 used=true(可用)
  • 但一旦你执行 USE MODULES ...只有出现在列表里的模块会保持 used
    没出现在列表里的,即使已经 loaded,也会变成 disabled(used=false)

所以你会看到类似:

sql 复制代码
SHOW FULL MODULES;
-- hive true
-- core false

这就是为什么"我之前还能用的函数突然找不到了"的典型原因之一:你换了模块启用列表。

4、Java 里怎么用?(executeSql 返回 OK 的那种)

在 Java(TableEnvironment / StreamTableEnvironment)里,你直接:

java 复制代码
tEnv.executeSql("USE CATALOG cat1");
tEnv.executeSql("USE db1");
tEnv.executeSql("USE MODULES hive");

成功会返回 OK(或者对应的 TableResult 可打印),失败则抛异常。

建议你在平台化/脚本执行场景里,把每一次 USE 都当成"可能失败的边界",明确 catch 并记录上下文(当前 catalog/db/modules)。

5、一套推荐的"工程化用法"(避免环境漂移)

如果你在写作业/平台,强烈建议遵循这三条:

  1. 任何 DDL/DML 执行前,显式 USE CATALOG + USE db

    避免默认的 default_catalog.default_database 导致表建错位置。

  2. 模块切换要谨慎USE MODULES hive 会导致 core 被禁用(不在列表里)

    如果你依赖 core 的函数或规则,记得把它放进列表里:

    sql 复制代码
    USE MODULES hive, core;
  3. 对外提供 SQL 执行能力时 :建议每个会话隔离上下文

    因为 USE 改的是"会话级的当前上下文",很容易造成串环境问题。

6、总结

  • USE CATALOG xxx:切换当前 catalog(默认 default_catalog
  • USE dbUSE catalog.db:切换当前数据库(默认 default_database
  • USE MODULES ...:控制函数/类型/规则等元数据解析来源与优先级(默认模块 core
  • 三者组合决定:你不写全限定名时,SQL 到底解析到哪里、函数到底用哪个实现
相关推荐
云小逸20 小时前
【nmap源码学习】 Nmap网络扫描工具深度解析:从基础参数到核心扫描逻辑
网络·数据库·学习
肉包_51120 小时前
两个数据库互锁,用全局变量互锁会偶发软件卡死
开发语言·数据库·c++
霖霖总总20 小时前
[小技巧64]深入解析 MySQL InnoDB 的 Checkpoint 机制:原理、类型与调优
数据库·mysql
此刻你21 小时前
常用的 SQL 语句
数据库·sql·oracle
それども21 小时前
分库分表的事务问题 - 怎么实现事务
java·数据库·mysql
·云扬·1 天前
MySQL Binlog 配置指南与核心作用解析
数据库·mysql·adb
天空属于哈夫克31 天前
Java 版:利用外部群 API 实现自动“技术开课”倒计时提醒
数据库·python·mysql
eWidget1 天前
随机森林原理:集成学习思想 —— Java 实现多棵决策树投票机制
java·数据库·随机森林·集成学习·金仓数据库
Traced back1 天前
SQL Server 核心语法+进阶知识点大全(小白版)
数据库·sqlserver
资深web全栈开发1 天前
PostgreSQL枚举还是字符串:ENUM vs VARCHAR + CHECK 的权衡
数据库·postgresql