Kafka简介

  1. Kafka核心要点
  • 基础概念:是分布式消息系统,有高吞吐量、可扩展等特性。包含Producer、Consumer等多种角色,消息按Topic分类存储,支持两种消息队列模式。

  • 安装与配置:安装前需准备JDK和Zookeeper,下载解压后修改配置文件,分发安装包到集群节点,配置环境变量后可启动。

  • 命令行操作:可进行Topic创建、查看、删除,数据生产与消费等操作。

  • 架构原理:消息以Topic分类,Partition对应log文件存储数据,通过分片和索引提升效率。生产者有分区策略和可靠性保证机制,消费者采用拉模式,有分区分配和offset维护策略。

  • 组件整合:与Flume整合可实现数据监控传输,与SparkStreaming整合需导包并进行代码配置,还可利用Redis维护偏移量。

  1. Spark Core部署关键
  • Yarn模式部署:解压缩并重命名文件,修改Hadoop和Spark配置文件,启动HDFS和Yarn集群后提交测试应用,配置历史服务可记录任务运行情况。

  • Windows模式部署:解压到指定路径,执行bin目录下的spark-shell.cmd启动本地环境,在命令行执行代码指令进行操作。

相关推荐
HAPPY酷3 小时前
Kafka 和Redis 在系统架构中的位置
redis·kafka·系统架构
忆雾屿4 小时前
云原生时代 Kafka 深度实践:06原理剖析与源码解读
java·后端·云原生·kafka
TCChzp6 小时前
Kafka入门-消费者
分布式·kafka
qq_4084133911 小时前
spark 执行 hive sql数据丢失
hive·sql·spark
后端码匠11 小时前
Spark 单机模式部署与启动
大数据·分布式·spark
Dnui_King12 小时前
Kafka 入门指南与一键部署
分布式·kafka
TCChzp13 小时前
Kafka入门-生产者
分布式·kafka
qq_4639448614 小时前
【Spark征服之路-2.3-Spark运行架构】
大数据·架构·spark
计算机毕设定制辅导-无忧学长14 小时前
Kafka 快速上手:安装部署与 HelloWorld 实践(二)
分布式·kafka
计算机毕设定制辅导-无忧学长1 天前
Kafka 核心架构与消息模型深度解析(二)
架构·kafka·linq