1. UPDATE 是干什么的?
UPDATE 用于对目标表执行行级更新:
- 不带 WHERE:更新全表
- 带 WHERE:只更新符合条件的行
2. 重要限制(一定要先看)
⚠️ 注意
1)UPDATE 目前只支持 Batch 模式
2)目标表连接器必须实现
SupportsRowLevelUpdate,否则执行 UPDATE 会直接抛异常3)目前 Flink 官方维护的连接器 还没有支持 UPDATE(也就是说你用常见 connector 基本会踩坑)
换句话说:UPDATE 的语法是 SQL 层提供的,但是否能落到外部存储上,取决于 connector 是否"接得住"这个语义。
3. 语法速记
sql
UPDATE [catalog_name.][db_name.]table_name
SET column_name1 = expression1 [, column_name2 = expression2, ...]
[ WHERE condition ]
4. Java 实战示例(Batch 模式 + 全表更新 + 条件更新)
下面是你提供示例的"更清爽版本",保留关键点:
java
EnvironmentSettings settings =
EnvironmentSettings.newInstance().inBatchMode().build();
TableEnvironment tEnv = TableEnvironment.create(settings);
// 1) 注册表
tEnv.executeSql(
"CREATE TABLE Orders (" +
" `user` STRING, " +
" product STRING, " +
" amount INT" +
") WITH (...)");
// 2) 插入数据
tEnv.executeSql(
"INSERT INTO Orders VALUES " +
"('Lili', 'Apple', 1), " +
"('Jessica', 'Banana', 1)"
).await();
// 3) 全表更新:amount * 2
tEnv.executeSql("UPDATE Orders SET `amount` = `amount` * 2").await();
// 4) 条件更新:只更新 user='Lili'
tEnv.executeSql("UPDATE Orders SET `product` = 'Orange' WHERE `user` = 'Lili'").await();
✅ 小细节建议
字段名
user使用反引号包裹是好习惯,避免和关键字冲突。
5. UPDATE 执行机制:会立刻提交一个 Flink 作业
在 Table API/SQL 语义里,executeSql("UPDATE ...") 会立即提交一个 Flink Job ,并返回 TableResult(你可以拿到 Job 信息/客户端进行管理)。
你可以理解为:UPDATE 在 Flink 中不是"数据库里瞬间改一行",而是"提交一段批作业去完成更新"。
6. 为什么你很可能跑不起来?(最常见报错原因)
6.1 connector 不支持行级更新
这是最常见的:你用的目标表 connector 没实现 SupportsRowLevelUpdate。
表现:执行 UPDATE 直接异常(提示 connector/表不支持 row-level update)。
6.2 你不是 Batch 模式
UPDATE 目前只支持 batch,如果你在 stream 模式下尝试,会失败或不符合语义预期。
7. 现实落地:既然官方 connector 目前不支持 UPDATE,那怎么办?
这里给你一个"工程上的选择表"(直接可写进博客提高含金量):
方案 A:用"重算 + 覆盖写"替代 UPDATE(离线最常用)
适用于离线数仓/批处理:
- 重新计算结果
- 写入新表/新分区
- 用交换表名或覆盖方式替代行级更新
方案 B:用主键 Upsert 语义(如果你的目标系统更适合)
某些系统更适合用 upsert sink:
- 通过主键写入最新值
- 不是 SQL UPDATE 语义,但在业务上达到"更新"效果
方案 C:自研/第三方 connector 真正实现 row-level update
如果你确实需要"行级更新",那就只能走 connector 能力建设:实现 SupportsRowLevelUpdate 并让 planner 能生成对应写入逻辑。
8. 总结
- Flink SQL
UPDATE是 行级更新能力 - 只支持 Batch 模式
- 依赖 connector 实现
SupportsRowLevelUpdate - 由于现状限制,生产中更常见做法是用 重算覆盖 / upsert 语义 / connector 能力补齐 来替代纯 UPDATE