Kafka常见使用问题

cocotww2024-03-12 14:03

消息丢失

生产者方：设置ack为1或-1/all可以防止生产的消息丢失，如果要做到生产消息成功率提高到最高，ack设置成all，把min.insync.replicas配置成分区备份数，把ack设置成1或者-1/all，这样生产者生产的消息发送到broker中，会等待leader或者至少leader和一个副本同步到消息才会返回ack，如果生产者同步消息失败，会进行重试

php 复制代码

		$conf->set('message.send.max.retries', 5);
        // -1必须等所有brokers同步完成的确认 1当前服务器确认 0不确认，这里如果是0回调里的offset无返回，如果是1和-1会返回offset
        // 我们可以利用该机制做消息生产的确认，不过还不是100%，因为有可能会中途kafka服务器挂掉
        $conf->set('request.required.acks', 1);

消费者方：把自动提交改为手动提交offset

重复消费

生产者：通过ack设置，尽量保证消息不回重复发送，但是因为网络抖动和重试机制，还是会导致消息重复
消费者：对关键数据进行幂等处理，防止关键数据重复处理。一般实现幂等的操作:
- 数据投递之前生成唯一uuid
- 数据消费的时候，使用乐观锁，防止重复消费

保持数据有序

生产者投递数据时，支持根据关键数据（例如uid）生成哈希值，同一个uid可以投递到指定的partition
日志类的数据，可以在投递数据前，就记录生成时间，消费的时候，根据时间存储到db中

上一篇：引入cheerio，超级简单的node爬虫

下一篇：msfconsole中db_namp的使用方法以及如何让msf连接数据库

热门推荐

01如何新建文件夹？电脑新建文件夹的4种方法 02GitHub 镜像站点 032026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 04国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）052026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？06AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 07微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 08AI科技热点日报 | 2026年07月01日 09Agnes AI 免费 API 接入指南：文本、生图、生视频，一套接口全免费 102026上半年大模型全景技术解读：推理融合、Agent 爆发与多模态统一