Flink流批一体计算(15):PyFlink Tabel API之SQL写入Sink

目录

举个例子

写入Sink的各种情况

[1. 将结果数据收集到客户端](#1. 将结果数据收集到客户端)

[2. 将结果数据转换为Pandas DataFrame,并收集到客户端](#2. 将结果数据转换为Pandas DataFrame,并收集到客户端)

[3. 将结果写入到一张 Sink 表中](#3. 将结果写入到一张 Sink 表中)

[4. 将结果写入多张 Sink 表中](#4. 将结果写入多张 Sink 表中)


举个例子

将计算结果写入给 sink 表

python 复制代码
#将Table API结果表数据写入sink表:
result_table.execute_insert("print").wait()
# 或者通过SQL查询语句来写入sink表:
table_env.execute_sql("INSERT INTO print SELECT * FROM datagen").wait()

写入Sink的各种情况

1. 将结果数据收集到客户端

你可以使用 TableResult.collect 将 Table 的结果收集到客户端,结果的类型为迭代器类型。

以下代码展示了如何使用 TableResult.collect() 方法:

python 复制代码
#准备source表
source = table_env.from_elements([(1, "Hi", "Hello"), (2, "Hello", "Hello")], ["a", "b", "c"])
#得到TableResult
res = table_env.execute_sql("select a + 1, b, c from %s" % source)
#遍历结果
with res.collect() as results:
   for result in results:
       print(result)

2. 将结果数据转换为Pandas DataFrame,并收集到客户端

3. 将结果写入到一张 Sink 表中

你可以调用 execute_insert 方法来将 Table 对象中的数据写入到一张 sink 表中:

python 复制代码
table_env.execute_sql("""
    CREATE TABLE sink_table (
        id BIGINT,
        data VARCHAR
    ) WITH (
        'connector' = 'print'
    )
""")
table = table_env.from_elements([(1, 'Hi'), (2, 'Hello')], ['id', 'data'])
table.execute_insert("sink_table").wait()

也可以通过 SQL 来完成

python 复制代码
table_env.create_temporary_view("table_source", table)
table_env.execute_sql("INSERT INTO sink_table SELECT * FROM table_source").wait()

4. 将结果写入多张 Sink 表中

你也可以使用 Statementset 在一个作业中将 Table 中的数据写入到多张 sink 表中:

create_statement_set() 创建一个可接受 DML 语句或表的 Statementset 实例。 它可用于执行包含多个 sink 的作业。

python 复制代码
# 准备 source 表和 sink 表
table = table_env.from_elements([(1, 'Hi'), (2, 'Hello')], ['id', 'data'])
table_env.create_temporary_view("simple_source", table)
table_env.execute_sql("""
    CREATE TABLE first_sink_table (
        id BIGINT,
        data VARCHAR
    ) WITH (
        'connector' = 'print'
    )
""")
table_env.execute_sql("""
    CREATE TABLE second_sink_table (
        id BIGINT,
        data VARCHAR
    ) WITH (
        'connector' = 'print'
    )
""")
# 创建 statement set
statement_set = table_env.create_statement_set()
# 将 "table" 的数据写入 "first_sink_table"
statement_set.add_insert("first_sink_table", table)
# 通过一条 sql 插入语句将数据从 "simple_source" 写入到 "second_sink_table"
statement_set.add_insert_sql("INSERT INTO second_sink_table SELECT * FROM simple_source")
# 执行 statement set
statement_set.execute().wait()
相关推荐
cui_ruicheng8 小时前
MySQL(四):数据类型与字段设计
数据库·mysql
皮皮学姐分享-ppx9 小时前
政府绿色采购数据库(2015-2024.3)
大数据·网络·数据库·人工智能·制造
闪电悠米11 小时前
黑马点评-Redis 消息队列-03_stream_consumer_group
开发语言·数据库·redis·分布式·缓存·junit·lua
DIY源码阁11 小时前
JavaSwing航班订票管理系统 - MySQL版
数据库·mysql
浪客灿心13 小时前
项目篇:模块设计与实现
数据库·c++
流星白龙14 小时前
【MySQL高阶】26.事务(1)
数据库·mysql
三十..15 小时前
Redis 核心原理与高可用架构实践
运维·数据库·redis
这个DBA有点耶15 小时前
索引优化深潜(下):索引合并、ICP 与索引设计的实战法则
数据库·mysql·架构
努力努力再努力wz15 小时前
【内存管理与高并发内存池系列】从 mmap 到 malloc:文件映射、匿名映射与 glibc 内存分配机制详解
linux·c语言·数据结构·数据库·c++·qt·链表
Theo·Chan15 小时前
机房断电搞崩服务器 | 人大金仓 V8 全量备份跨实例完整恢复实录
sql·信创·kingbase·金仓