【学习笔记】kafka权威指南——第7章 构建数据管道(7-10章只做了解)

第7章 构建数据管道

7.1 构建数据管道时需要考虑的问题

7.1.1 及时性

可以实时处理,也可以每天某时间大量处理,kafka作为数据的大型缓冲区

7.1.2 可靠性

7.1.3 高吞吐量和动态吞吐量

kafka高吞吐量,且作为中间缓存积压数据节点

7.1.4 数据格式

7.1.5 转换

数据转换可在数据管道做(ETL),也可在目标系统做(ELT)

7.1.6 安全性

kafka支持加密与认证

7.1.7故障处理能力

kafka缓冲区数据可保存一段时间,可在时间内重新处理出错数据

7.1.8 耦合性和灵活性(P105)

处理不同数据源同一个数据管道,生产与消费耦合,尽量保留数据完整性

7.2 如何在Connect API和客户端API之间做出选择

一般需与数据库交互时使用ConnectAPI

7.3 kafka Connect

7.3.1 运行Connect(P106)

7.3.2 略

7.3.4 深入理解Connect

1>连接器和任务

连接器:决定运行多少个任务,拆分数据复制,传递任务配置

任务:将数据移入溢出kafka

2>worker进程

处理HTTP请求,主要负责RESTAPI,配置,可靠性,高可用性、伸缩性和负载均衡

3>转化器和Connect的数据模型

连接器将库中数据变为DataAPI数据,转化器负责DataAPI与kafka中数据的转化

4>偏移量管理

会保存数据源与目标源的偏移量

7.4 Connect之外的选择(P116)

相关推荐
我命由我123454 分钟前
Photoshop - Photoshop 工具栏(58)锐化工具
学习·ui·职场和发展·求职招聘·职场发展·学习方法·photoshop
前端小菜袅13 分钟前
AI时代,新的技术学习方式
学习·ai编程
victory043120 分钟前
大模型学习阶段总结和下一阶段展望
深度学习·学习·大模型
程序猿零零漆24 分钟前
Spring之旅 - 记录学习 Spring 框架的过程和经验(十三)SpringMVC快速入门、请求处理
java·学习·spring
曾浩轩33 分钟前
跟着江协科技学STM32之4-5OLED模块教程OLED显示原理
科技·stm32·单片机·嵌入式硬件·学习
CCPC不拿奖不改名1 小时前
网络与API:从HTTP协议视角理解网络分层原理+面试习题
开发语言·网络·python·网络协议·学习·http·面试
却道天凉_好个秋1 小时前
音视频学习(八十四):视频压缩:MPEG 1、MPEG 2和MPEG 4
学习·音视频
●VON1 小时前
AI 保险机制:为智能时代的不确定性兜底
人工智能·学习·安全·制造·von
代码游侠1 小时前
学习笔记——HC-SR04 超声波测距传感器
开发语言·笔记·嵌入式硬件·学习
军军君011 小时前
Three.js基础功能学习七:加载器与管理器
开发语言·前端·javascript·学习·3d·threejs·三维