spark

阶段性

阶段一:

单机时代

阶段二:

大数据时代-分布式处理

阶段三:

实时大数据时代

hadoop慢因为她的计算结果保存在磁盘 处理在spark中可解决属于内存

Hadoop特点:

高可靠性

高拓展性

高效性

高容错性

相关推荐
回家路上绕了弯5 小时前
分布式事务SAGA模式详解:长事务与复杂流程的柔性事务方案
分布式·后端
Gofarlic_oms17 小时前
集中式 vs 分布式许可:跨地域企业的管控架构选择
大数据·运维·人工智能·分布式·架构·数据挖掘·需求分析
神秘面具男038 小时前
ceph分布式存储
分布式·ceph
北亚数据恢复8 小时前
VSAN分布式存储下非正常关机导致的虚拟机磁盘丢失如何恢复数据?
分布式·数据恢复·服务器数据恢复·北亚数据恢复·vsan数据恢复
阎*水9 小时前
Ceph 分布式存储完整实践指南
linux·运维·分布式·ceph
yours_Gabriel10 小时前
【kafka】基本概念
分布式·中间件·kafka
柒.梧.11 小时前
MyBatis一对一关联查询深度解析:大实体类、SQL99联表、分布式查询实践
分布式·mybatis
Wang's Blog12 小时前
Kafka: Admin 客户端操作指南之主题管理与集群监控
分布式·kafka
是阿威啊12 小时前
企业级的RDD、 Spark SQL、DataFrame、Dataset使用场景介绍
大数据·sql·spark
源代码•宸12 小时前
goframe框架签到系统项目开发(用户认证、基于 JWT 实现认证、携带access token获取用户信息)
服务器·开发语言·网络·分布式·后端·golang·jwt