spark

阶段性

阶段一:

单机时代

阶段二:

大数据时代-分布式处理

阶段三:

实时大数据时代

hadoop慢因为她的计算结果保存在磁盘 处理在spark中可解决属于内存

Hadoop特点:

高可靠性

高拓展性

高效性

高容错性

相关推荐
juniperhan3 小时前
Flink 系列第21篇:Flink SQL 函数与 UDF 全解读:类型推导、开发要点与 Module 扩展
java·大数据·数据仓库·分布式·sql·flink
marsh020613 小时前
41 openclaw分布式会话管理:跨服务状态同步方案
分布式·ai·编程·技术
渣渣盟14 小时前
大数据技术栈全景图:从零到一的入门路线(深度实战版)
大数据·hadoop·python·flink·spark
杰建云16714 小时前
Plurai 分布式推理引擎深度评测
分布式
星筏17 小时前
深入理解分布式锁:ZooKeeper vs Redis
redis·分布式·zookeeper
无籽西瓜a17 小时前
【西瓜带你学Kafka | 第六期】Kafka 生产确认、消费 API 与分区分配策略(文含图解)
java·分布式·后端·kafka·消息队列·mq
紧固视界18 小时前
分布式光伏系统中紧固件选型与应用解析_2026上海紧固件专业展
分布式·上海紧固件展·紧固件展·上海紧固件专业展
无籽西瓜a18 小时前
【西瓜带你学Kafka | 第七期】Kafka 日志存储体系:保留清理、消息格式与分段刷新策略(文含图解)
java·分布式·后端·kafka·消息队列·mq
苍煜1 天前
分布式事务生产实战选型对比
分布式
JAVA面经实录9171 天前
企业级java+LangChain4j-RAG系统 限流熔断降级
java·开发语言·分布式·langchain