【学习笔记】kafka权威指南——第7章 构建数据管道(7-10章只做了解)

第7章 构建数据管道

7.1 构建数据管道时需要考虑的问题

7.1.1 及时性

可以实时处理,也可以每天某时间大量处理,kafka作为数据的大型缓冲区

7.1.2 可靠性

7.1.3 高吞吐量和动态吞吐量

kafka高吞吐量,且作为中间缓存积压数据节点

7.1.4 数据格式

7.1.5 转换

数据转换可在数据管道做(ETL),也可在目标系统做(ELT)

7.1.6 安全性

kafka支持加密与认证

7.1.7故障处理能力

kafka缓冲区数据可保存一段时间,可在时间内重新处理出错数据

7.1.8 耦合性和灵活性(P105)

处理不同数据源同一个数据管道,生产与消费耦合,尽量保留数据完整性

7.2 如何在Connect API和客户端API之间做出选择

一般需与数据库交互时使用ConnectAPI

7.3 kafka Connect

7.3.1 运行Connect(P106)

7.3.2 略

7.3.4 深入理解Connect

1>连接器和任务

连接器:决定运行多少个任务,拆分数据复制,传递任务配置

任务:将数据移入溢出kafka

2>worker进程

处理HTTP请求,主要负责RESTAPI,配置,可靠性,高可用性、伸缩性和负载均衡

3>转化器和Connect的数据模型

连接器将库中数据变为DataAPI数据,转化器负责DataAPI与kafka中数据的转化

4>偏移量管理

会保存数据源与目标源的偏移量

7.4 Connect之外的选择(P116)

相关推荐
超级大只老咪5 小时前
快速进制转换
笔记·算法
Fᴏʀ ʏ꯭ᴏ꯭ᴜ꯭.8 小时前
Keepalived VIP迁移邮件告警配置指南
运维·服务器·笔记
ling___xi9 小时前
《计算机网络》计网3小时期末速成课各版本教程都可用谢稀仁湖科大版都可用_哔哩哔哩_bilibili(笔记)
网络·笔记·计算机网络
星火开发设计9 小时前
类型别名 typedef:让复杂类型更简洁
开发语言·c++·学习·算法·函数·知识
Gorgous—l9 小时前
数据结构算法学习:LeetCode热题100-多维动态规划篇(不同路径、最小路径和、最长回文子串、最长公共子序列、编辑距离)
数据结构·学习·算法
中屹指纹浏览器10 小时前
中屹指纹浏览器底层架构深度解析——基于虚拟化的全维度指纹仿真与环境隔离实现
经验分享·笔记
Hello_Embed10 小时前
libmodbus 移植 STM32(基础篇)
笔记·stm32·单片机·学习·modbus
无聊的小坏坏10 小时前
实习笔记:用 /etc/crontab 实现定期数据/日志清理
笔记·实习日记
香芋Yu10 小时前
【机器学习教程】第04章 指数族分布
人工智能·笔记·机器学习