分布式

回家路上绕了弯5 小时前
分布式·后端
大表优化实战指南:从千万到亿级数据的性能蜕变在业务快速增长的背景下,数据库表数据量往往会突破千万、甚至亿级门槛 —— 此时你可能会遇到查询响应超时、DDL 操作阻塞、备份恢复耗时过长等问题。大表优化不是 “一键操作”,而是覆盖设计、查询、存储、维护的系统工程。本文将结合实际场景,拆解大表优化的核心思路与可落地方案,帮你实现从 “卡到用不了” 到 “秒级响应” 的蜕变。
CrazyClaz5 小时前
分布式·分布式事务
分布式事务专题5可靠消息最终一致性方案是指当事务发起方执行完成本地事务后并发出一条消息,事务参与方(消息消费者)一定能够接收消息并处理事务成功,此方案强调的是只要消息发给事务参与方最终事务要达到一致。
灯下夜无眠7 小时前
大数据·分布式·spark
spark集群文件分发问题有一份csv数据在当前节点的本地路径上,本地模式跑可以通过:file://+本地路径正常读取当需要跑集群模式时,由于其他节点访问不到该路径会报错,解决办法是想办法使得所有节点可以访问该文件,可以通过以下方式解决: 1、使用HDFS路径,将数据上传到hdfs 这是生产环境最标准的方式,将数据上传到HDFS上,让所有节点通过同一地址访问得到该数据; 2、无权限上传hdfs时,使用 --files + SparkFiles.get() 脚本使用:SparkFiles.get()
少许极端7 小时前
redis·分布式·缓存
Redis入门指南:从零到分布式缓存-string类型这里我们再次强调, 这里对于value的不同数据结构的讨论, 而对于key来说, 只有string类型, 同时Redis在实现这些数据结构的时候, 在底层源码上会有特殊的优化, 来达到节省时间/空间的效果, 意味着数据类型只是Redis承诺给你的, 但内部的编码方式却不一定是和那些常见数据结构一样, 外表还是你眼熟的外表, 内部却可能早已不是你熟知的模样 1. string -> 类似于Java中的string 2. hash -> 类似于Java中的hashMap, 只是在Redis中value的类型又
Macbethad8 小时前
大数据·hadoop·分布式
WPF工业设备诊断管理程序技术方案WPF工业设备诊断管理程序技术方案本方案设计一个基于WPF的工业设备诊断管理程序,核心功能包括:采用分层架构和模块化设计,结合MVVM模式,实现高内聚低耦合。
Thomas21439 小时前
大数据·分布式·spark
pyspark3.5给paimon1.2的表打tag报错 spark_catalog is not a ProcedureCatalog执行 spark.sql("CALL sys.create_tag(`table` => 'pipeline.bigdata_biz.tb1', tag => 'tag_${last1day_dt}')" )
稚辉君.MCA_P8_Java9 小时前
大数据·hadoop·分布式·架构·mapreduce
Gemini永久会员 Hadoop分布式计算框架MapReduceHadoop分布式计算框架MapReduce是一种用于大规模数据集并行运算的编程模型,其核心思想是“分而治之”,通过Map和Reduce两个阶段实现数据的并行处理与汇总,具有强大的容错性和可扩展性,适用于批量数据处理任务。 以下是对MapReduce的详细介绍:
CrazyClaz10 小时前
分布式·分布式事务
分布式事务专题4TCC是Try、Confirm、Cancel三个词语的缩写,TCC要求每个分支事务实现三个操作:预处理Try、确认 Confirm、撤销Cancel。Try操作做业务检查及资源预留(例如,要转账1万元,try阶段会检查金额够不够1万元),Confirm做业务确认操作,Cancel实现一个与Try相反的 操作即回滚操作。TM首先发起所有的分支事务的try操作,任何一个分支事务的try操作执行失败,TM将会发起所 有分支事务的Cancel操作,若try操作全部成功,TM将会发起所有分支事务的Confirm操作
程序员小胖10 小时前
分布式·面试
每天一道面试题之架构篇|异步确保型事务——消息队列驱动的分布式事务解决方案面试官:"请详细解释异步确保型事务的原理,并说明如何通过消息队列实现分布式事务的最终一致性?"异步确保型事务是现代分布式系统中解决数据一致性问题的重要模式,通过将同步阻塞操作改为异步执行,显著提升系统性能。
CrazyClaz10 小时前
分布式·分布式事务
分布式事务专题2针对不同的分布式场景业界常见的解决方案有2PC、 TCC、可靠消息最终一致性、最大努力通知这几种。2PC即两阶段提交协议,是将整个事务流程分为两个阶段,准备阶段(Prepare phase)、提交阶段(commit phase),2是指两个阶段,P是指准备阶段,C是指提交阶段。
鹿衔`11 小时前
大数据·分布式·spark
CDH 6.3.2 集群外挂 Spark 3.5.7 (Paimon) 集成 Hue 实战指南目录1. 基础环境准备(权限与目录)2. 封装启动脚本3. 服务启动与验证3.1 启动服务3.2 状态验证
士心凡11 小时前
大数据·hadoop·分布式
hadoop核心组件:分块存储(默认 128MB/256MB Block),每个block维持3个副本不适合小文件,因为:
IIIIIILLLLLLLLLLLLL11 小时前
大数据·hadoop·分布式
Hadoop完全分布式安装Linux发行版有很多这里作者使用ubuntu来搭建。以下是Hadoop 完全分布式搭建VMware17 适配的Ubuntu、Hadoop、JDK的版本推荐:
鹿衔`12 小时前
大数据·分布式·spark
CDH 6.3.2 集群外挂部署 Spark 3.5.7 连接 Paimon 1.1.1 (一)为了解决CDH 6.3.2 默认的 Hive sql on Spark 和 Spark sql (Spark版本为2.4.0)无法写入修改Paimon 1.1.1 版本的表格数据的问题。
stella·12 小时前
java·分布式·中间件·消息队列·rabbitmq·削峰填谷
RabbitMQ是什么?如何使用消息队列(Message Queue,简称MQ)为什么会产生消息队列?有几个原因:不同进程(process)之间传递消息时,两个进程之间耦合程度过高,改动一个进程,引发必须修改另一个进程,为了隔离这两个进程,在两进程间抽离出一层(一个模块),所有两进程之间传递的消息,都必须通过消息队列来传递,单独修改某一个进程,不会影响另一个;
QQ_43766431412 小时前
网络·c++·分布式·rpc
分布式RPC网络框架mprpc是一个基于C++开发的轻量级RPC框架,它整合了muduo网络库的高性能I/O模型和Protobuf的高效序列化能力。框架的设计目标是提供简单易用、高性能的远程调用解决方案,支持服务自动注册与发现。
苦学编程的谢13 小时前
分布式·rabbitmq
RabbitMQ_3_RabbitMQ应用RabbitMQ官方文档:RabbitMQ Tutorials | RabbitMQ这是官方文档中提及的7种工作模式:
gugugu.13 小时前
分布式·微服务·架构
从单机到微服务:分布式架构演进全景解析在数字化浪潮席卷全球的今天,我们使用的每一个互联网应用背后,都隐藏着一套复杂的系统架构。从最初的单机服务器到如今的微服务云原生架构,分布式系统的演进之路如同一部技术进化史。本文将带您深入探索这一演进过程,揭示每个阶段背后的设计哲学与技术突破。
小股虫13 小时前
分布式·kafka
Kafka深度解析:从日志处理到流处理的“数据管道扛把子一句话总结:Apache Kafka是LinkedIn开源的分布式流处理平台,凭借"日志式存储+分区副本+流处理"的组合拳,实现了百万级TPS、毫秒级延迟、100%数据不丢失的能力,是日志收集、实时分析的"数据管道扛把子"! 核心亮点:Kafka的日志式存储和分区副本机制,让消息处理速度比传统消息队列快3倍,数据丢失率0%。
白露与泡影13 小时前
分布式·kafka·linq
Kafka:消费者重试与死信队列的对应模式分析在 Spring Kafka 中,消费者重试(@RetryableTopic) 与 死信队列(@DltHandler) 的对应关系及 死信 Topic 名称拼接 是保障消息可靠处理的核心机制。本文将详细解析两者的对应模式、Topic 名称生成规则,并结合生产实践给出最佳实践。