kafka入门

简介:

Kafka是一个由Apache软件基金会开发的开源流式数据处理平台。它最初是LinkedIn开发的分布式发布/订阅消息系统,用于处理大规模的实时数据。Kafka具有高吞吐量、可持久化存储、水平扩展性和容错性等特点,被广泛应用于日志收集、数据传输、指标收集等场景中。它提供了生产者和消费者API,以及流处理API,使得用户能够方便地构建实时数据处理应用程序。

Zookeeper:

ZooKeeper是一个由Apache软件基金会开发的开源分布式协调服务,用于管理和协调分布式应用程序。它提供了一个简单而健壮的接口,使得分布式应用程序能够在不同节点之间共享信息、同步状态和协调操作。ZooKeeper通常用于解决分布式系统中的一致性问题,例如选举算法、配置管理、命名服务等。它具有高可用性、强一致性和可靠性的特点,被广泛应用于诸如Hadoop、Kafka等分布式系统中作为基础设施来提供分布式协调服务。

注意:

启动Kafka的前提是启动Zookeeper

命令:

Zookeeper:

启动zookeeper

bin/zkServer.sh start

查看运行状态

bin/zkServer.sh start

关闭zookeeper

bin/zkServer.sh stop

Kafka:

启动kafka

前台启动: bin/kafka-server-start.sh config/server.properties

启动之后无法再输入其它命令

后台启动: bin/kafka-server-start.sh config/server.properties &

启动不打印日志,可以接着输入其它命令

关闭kafka

bin/kafka-server-stop.sh stop

查看当前服务器中的所有topic(话题 分类)

/opt/module/kafka/bin/kafka-topics.sh --zookeeper 192.168.231.131:2181 --list

创建topic

/opt/module/kafka/bin/kafka-topics.sh --zookeeper 192.168.47.129:2181 --create --replication-factor 1 --partitions 1 --topic gouwuche

选项说明:

-topic 定义topic名

--replication-factor 定义副本数

--partitions 定义分区数

3)删除topic

hadoop102 kafka\]$ bin/kafka-topics.sh --zookeeper 192.168.41.91:2181 --delete --topic (名字) first 需要server.properties中设置delete.topic.enable=true否则只是标记删除或者直接重启。 4)**发送消息**(指定向哪台服务器发送) \[hadoop102 kafka\]$ /opt/module/kafka/bin/kafka-console-producer.sh --broker-list 192.168.231.131:9092 --topic lanqiu 5)**消费消息** \[hadoop103 kafka\]$ /opt/module/kafka/bin/kafka-console-consumer.sh --zookeeper 192.168.231.131:2181 --from-beginning --topic gouwuche --from-beginning:会把first主题中以往所有的数据都读取出来。根据业务场景选择是否增加该配置。 6)**查看某个Topic的详情** \[hadoop102 kafka\]$ bin/kafka-topics.sh --zookeeper 192.168.41.91:2181 --describe --topic gouwuche **使用守护进程的方式启动** bin/kafka-server-start.sh -daemon config/server.properties

相关推荐
智汇优库8 分钟前
Rabbitmq下载和安装(Windows系统,百度网盘)
windows·分布式·rabbitmq
£菜鸟也有梦2 小时前
Hadoop进阶之路
大数据·hadoop·分布式
Hfc.4 小时前
es+kibana---集群部署
elasticsearch·kafka·jenkins
boring_1114 小时前
全局id生成器生产方案
大数据·分布式·后端
smileNicky5 小时前
RabbitMQ 启动报错 “crypto.app“ 的解决方法
分布式·rabbitmq·ruby
今天我又学废了8 小时前
Spark,集群搭建-Standalone
大数据·分布式·spark
麻芝汤圆11 小时前
在 IDEA 中写 Spark 程序:从入门到实践
java·大数据·hadoop·分布式·安全·spark·intellij-idea
LUCIAZZZ11 小时前
分布式链路追踪理论
java·分布式·中间件·操作系统·链路追踪
什么芮.14 小时前
Kafka和flume整合
spark·kafka·flume
群联云防护小杜19 小时前
云服务器主动防御策略与自动化防护(下)
运维·服务器·分布式·安全·自动化·音视频