分布式

失伟26 分钟前
分布式·kafka
kafka教程(新手使用单机版)kafka是一个分布式消息系统、所谓消息系统主要功能就是发布/订阅。为了省事,直接docker安装了,docker-compose.yml文件如下 概念说明:环境中一共包含四个 1、zookeeper:kafka数据调度,关键组件 2、kafka组件 3、kafka-connect 4、kafka-ui:kafka图形可视化 版本说明:kafka采用稳定版7.4.1,最新版有KRaft能够替代zookeeper,为了保险起见还是先用稳定版,如果用最新版就不用安装zookeeper
Xyz996_1 小时前
分布式·ceph
Ceph分布式存储一、存储基础 1、单机存储设备 (1)DAS(直接附加存储,是直接接到计算机的主板总线上去的存储) IDE、SATA、SCSI、SAS、USB 接口的磁盘
绝顶少年2 小时前
redis·分布式·缓存
Redis 五大核心应用场景实战解析:缓存、会话、排行榜、分布式锁与消息队列在高并发、分布式系统架构中,Redis 凭借其高性能、多数据结构、原子性操作等特性,成为了不可或缺的中间件。它不仅是 “内存数据库”,更是解决分布式系统核心痛点的瑞士军刀。本文将结合真实代码示例,深入拆解 Redis 最常用的五大应用场景,帮你理解其背后的设计思想与实战价值。
武子康2 小时前
java·大数据·分布式·oss·云存储·fastdfs·ali
Java-181 OSS 实战指南:Bucket/外链/防盗链/计费与常见坑阿里云对象存储服务(Object Storage Service, 简称 OSS),是阿里云提供的海量、安全、低成本、高可靠的云存储服务。其数据设计持久性不低于 99.99xx%(12个9),服务设计可用性或者业务连续性不低于 99.995%。
沧海寄馀生2 小时前
大数据·hadoop·分布式·apache
Apache Hadoop生态组件部署分享-Impala节点信息请参考:zookeeper: Apache Hadoop生态组件部署分享-zookeeperhadoop:Apache Hadoop生态组件部署分享-Hadoop
写bug的小屁孩2 小时前
分布式·中间件·kafka
5.Kafka-HW重要特性与场景分析HW 机制确保了消费者在所有副本上看到的数据是一致的。无论消费者连接到哪个副本(Leader 或 Follower),它都只能读到 HW 之前的消息。
嘉禾望岗5032 小时前
大数据·分布式·spark
spark计算框架与RDD特性介绍Apache Spark 是一个专为大规模数据处理而设计的快速、通用的计算引擎。最初由加州大学伯克利分校的 AMP 实验室(Algorithms, Machines, and People Lab)开发,并于 2010 年开源,2014 年成为 Apache 顶级项目。Spark 的诞生旨在突破传统 Hadoop MapReduce 在迭代计算和内存利用上的局限性,与 MapReduce 不同,Spark 可以将作业中间结果缓存于内存中,减少对磁盘的读写操作,因此在需要多次迭代计算的数据处理场景(如数据挖
不吃饭的猪3 小时前
分布式·kafka
kafka输出报错1,kakfa输出报错2,报错分析,报错显示kafka不支持事务,查官网验证kafka2.8版本是支持事务的,kafka是2.13-2.8.0的版本 3,代码中实现设置不适用事务也不行,2.8的客户端中实现实例的时候默认就是事务
写bug的小屁孩2 小时前
分布式·中间件·kafka
3.Kafka-数据存储流程kafka的数据存储流程总共是分为四个阶段。生产者发送与Broker的接收、日志追加与持久化、数据持久化到物理磁盘和索引与日志段滚动的四个阶段。这里暂时只做个简单的说明。后续的文章才会详细说明每个阶段里的细节。
写bug的小屁孩2 小时前
分布式·中间件·kafka
4.Kafka-LEO+HW的定义与特性+工作流程LEO和HW是Kafka数据一致性和副本同步状态的两个核心内容。定义:分区中最新的一条消息的偏移量+1,也就是下一条将要被写入的消息的偏移量位置。
黑客思维者2 小时前
分布式·系统安全·能源
IEEE 1547.3-2023:分布式能源系统安全互联的技术基石与实践路径IEEE 1547.3系列标准的迭代历程,本质上是分布式能源系统从“补充能源”向“电网核心参与者”转型的缩影。2007年首版标准聚焦DER与电力系统的监控、信息交换及控制基础要求,而2023年12月发布的新版标准(IEEE Std 1547.3-2023)则实现了三大核心升级,成为DER安全互联的技术标杆:
小股虫3 小时前
分布式·kafka·linq
Kafka副本管理深度剖析:从同步失败到自动恢复的完整生命线"Kafka集群告警:topic=order-events, partition=3 的ISR从[1,2,3]收缩为[1,2],当前min.insync.replicas=2,生产者写入开始阻塞!"凌晨2点,这样的告警让每个SRE心头一紧。这不是普通的故障,而是副本同步失败引发的连锁反应。更关键的是,为什么移除一个Follower后,系统没有自动补充新的副本?今天,我们就深入Kafka内核,揭开副本管理的完整生命线。
黑客思维者3 小时前
分布式·能源·ieee1547.3
IEEE 1547.3-2023在分布式能源(DER)系统应用中面临的挑战IEEE 1547.3系列标准的迭代演进,深刻映射了分布式能源系统(DER)从电网“补充性能源”到“核心参与主体”的转型轨迹。2007年首版标准聚焦于DER与电力系统互联的基础框架,明确了监控交互、信息传输及控制协调的核心要求,为分布式能源的初步并网提供了技术遵循;而2023年12月正式发布的新版标准(IEEE Std 1547.3-2023)通过三大维度的突破性升级,构建起更为完善的技术体系,已然成为新时代DER安全、高效接入电网的核心技术标杆。
脸大是真的好~3 小时前
分布式·rabbitmq
尚硅谷-消息队列-rabbitMQ1.同步和异步有什么差别? a.快递员送快递,直接送给收件人,是同步操作; b.员送快递,放快递柜,收件人自己去快递柜收取,是异步操作; 同步操作: 异步操作: 2.为什么需要消息队列? MQ对比: 2.什么是RabbitMQ 2.1 RabbitMQ安装 2.2 登录后界面
IIIIIILLLLLLLLLLLLL13 小时前
大数据·hadoop·分布式
Hadoop集群时间同步方法本文基于Lniux的Ubuntu发行版对Hadoop集群时间进行同步操作。首先我们得了解什么是NTP服务:
回家路上绕了弯18 小时前
分布式·后端
大表优化实战指南:从千万到亿级数据的性能蜕变在业务快速增长的背景下,数据库表数据量往往会突破千万、甚至亿级门槛 —— 此时你可能会遇到查询响应超时、DDL 操作阻塞、备份恢复耗时过长等问题。大表优化不是 “一键操作”,而是覆盖设计、查询、存储、维护的系统工程。本文将结合实际场景,拆解大表优化的核心思路与可落地方案,帮你实现从 “卡到用不了” 到 “秒级响应” 的蜕变。
CrazyClaz19 小时前
分布式·分布式事务
分布式事务专题5可靠消息最终一致性方案是指当事务发起方执行完成本地事务后并发出一条消息,事务参与方(消息消费者)一定能够接收消息并处理事务成功,此方案强调的是只要消息发给事务参与方最终事务要达到一致。
灯下夜无眠21 小时前
大数据·分布式·spark
spark集群文件分发问题有一份csv数据在当前节点的本地路径上,本地模式跑可以通过:file://+本地路径正常读取当需要跑集群模式时,由于其他节点访问不到该路径会报错,解决办法是想办法使得所有节点可以访问该文件,可以通过以下方式解决: 1、使用HDFS路径,将数据上传到hdfs 这是生产环境最标准的方式,将数据上传到HDFS上,让所有节点通过同一地址访问得到该数据; 2、无权限上传hdfs时,使用 --files + SparkFiles.get() 脚本使用:SparkFiles.get()
少许极端21 小时前
redis·分布式·缓存
Redis入门指南:从零到分布式缓存-string类型这里我们再次强调, 这里对于value的不同数据结构的讨论, 而对于key来说, 只有string类型, 同时Redis在实现这些数据结构的时候, 在底层源码上会有特殊的优化, 来达到节省时间/空间的效果, 意味着数据类型只是Redis承诺给你的, 但内部的编码方式却不一定是和那些常见数据结构一样, 外表还是你眼熟的外表, 内部却可能早已不是你熟知的模样 1. string -> 类似于Java中的string 2. hash -> 类似于Java中的hashMap, 只是在Redis中value的类型又
Macbethad1 天前
大数据·hadoop·分布式
WPF工业设备诊断管理程序技术方案WPF工业设备诊断管理程序技术方案本方案设计一个基于WPF的工业设备诊断管理程序,核心功能包括:采用分层架构和模块化设计,结合MVVM模式,实现高内聚低耦合。