【架构-8】Lambda和Kappa架构

Lambda架构?

Lambda架构(三层架构):

(1)将数据处理分为实时和离线两部分。离线部分通过批量计算处理数据,实时部分则通过增加追加方式将数据合并到批处理中。

(2)批处理和增量处理独立存在,适合处理大数据量的场景。

(3)适用于离线批处理和增量处理场景,如离线数据分析、报表生成等。

批处理层:存储数据集。

【MapReduce】【Spark】

加速层:处理最近的增量数据流。

【Spark Streaming】【Storm】

服务层:合并批视图和实时视图中的结果数据集到最终数据集。

【Redis】【MySQL】【HBase】【Hive】

优点:(1)容错性好(2)灵活度高(3)易伸缩易扩展

缺点:(1)全场景覆盖带来的编码开销(2)重新部署和迁移成本高

应用实例

Kappa架构?

Kappa架构(二层架构):

(1)以流处理为主的数据分析架构,实时层流式处理输入数据,生成实时视图,服务层接受用户请求,查询实时视图,响应用户请求。

(2)流式处理,适合处理实时数据。

(3)适用于实时性要求高的场景,如金融、物流等领域的实时监控、预警等。

实时层:处理输入数据,生成实时视图。

【采用Apache Kafka回访数据】

【采用Flink或Spark Streaming处理】

服务层:使用实时视图中的结果数据集响应用户请求。

【一般使用数据仓库或数据湖中的缓存或存储作为服务层】

优点:离线和实时处理代码统一,将实时和离线统一起来,方便进行数据处理;具有低延迟、高吞吐量、高可扩展性等优点。

缺点:计算能力相对较弱,难以即时响应;过度依赖特定组件(如Redis和HBase)。

应用实例

Lambda和Kappa架构的区别?


相关推荐
创码小奇客16 分钟前
Spring Boot依赖排坑指南:冲突、循环依赖全解析+实操方案
后端·面试·架构
绝无仅有1 小时前
Redis 面试题解析:某度互联网大厂
后端·面试·架构
绝无仅有1 小时前
某度互联网大厂 MySQL 面试题解析
后端·面试·架构
国科安芯2 小时前
核电厂执行器控制系统中的抗辐照MCU选型:为什么需要150krad(Si) TID指标?
服务器·单片机·嵌入式硬件·fpga开发·架构
卡奥斯开源社区官方8 小时前
NVIDIA Blackwell架构深度解析:2080亿晶体管如何重构AI算力规则?
人工智能·重构·架构
黄雪超9 小时前
从流批一体到湖仓一体架构演进的思考
大数据·架构·数据湖
周杰伦_Jay12 小时前
【智能体(Agent)技术深度解析】从架构到实现细节,核心是实现“感知环境→处理信息→决策行动→影响环境”的闭环
人工智能·机器学习·微服务·架构·golang·数据挖掘
hweiyu0013 小时前
Docker(K8S)容器架构教程(视频教程)
docker·架构·kubernetes
眠りたいです14 小时前
基于脚手架微服务的视频点播系统-客户端业务逻辑处理部分(三)-客户端主体部分完结
c++·微服务·云原生·架构·json·restful·qt6.7
孟祥_成都18 小时前
最好的组件库教程又回来了,升级为 headless 组件库!
前端·面试·架构