在flinkCDC源数据配置中,只对表中的部分字段关注,通过监控部分字段进行数据更新或者不更新,对数据进行同步。主要通过以下两个参数:
column.exclude.list
默认: 空字符串
一个可选的、以逗号分隔的正则表达式列表,与列的完全限定名称匹配以从更改事件记录值中排除。列的完全限定名称的格式为databaseName。表名。列名。
column.include.list
默认: 空字符串
一个可选的、以逗号分隔的正则表达式列表,与列的完全限定名称匹配以包含在更改事件记录值中。列的完全限定名称的格式为databaseName。表名。列名。
单表可以只写列名,如果是多表、多库,必须要:databaseName.表名.列名,这种方式的配置。
REATE TABLE IF NOT EXISTS `test_source` (
`testid` varchar ( 32 ),
`name` int,
`addre` varchar ( 100 ),
`stat` int,
`updateTime` TIMESTAMP,
PRIMARY KEY ( `testid` ) NOT ENFORCED
) WITH (
'connector' = 'mysql-cdc',
'hostname' = '*******',
'port' = '**',
'username' = '***',
'password'='********',
'database-name' = 'dbname',
'scan.startup.mode' = 'initial',
'debezium.skipped.operations'='d,c',
'table-name' = 'tablename',
'debezium.column.include.list'='name,addre'
);