大数据Spark教程从入门到精通第三篇:Spark核心模块

一:Spark核心模块

1:概述

Spark最底层的模块是Apache Spark Core,其他的功能都是基于此实现的。

Spark SQL操作结构化数据的模块

Spark Streaming 对流式数据处理的模块。

Spark MLlib对机器学习支持的一个功能模块。学习难度很高

Spark GraphX对图形挖掘支持的一个功能模型。学习难度很高

2:详解

Spark Core

Spark Core 中提供了 Spark 最基础与最核心的功能,Spark其他的功能如:Spark Streaming、Spark SQLGraphX、 MIlib都是在 Spark Core 的基础上进行扩展的

Spark SQL

Spark SQL 是 Spark用来操作结构化数据的组件。通过 Spark SQL,用户可以使用 SQI或者 Apache Hive 版本的 SOL 方言(HQL)来查询数据。

Spark Streaming

Spark Streaming 是 Spark 平台上针对实时数据进行流式计算的组件,提供了丰富的处理数据流的 API。

相关推荐
张人玉11 分钟前
LiveCharts WPF MVVM 图表开发笔记
大数据·分布式·wpf·livecharts
建投数据23 分钟前
建投数据再度获评国家级“高新技术企业”
大数据·人工智能
不惑_25 分钟前
Kurator 分布式云原生平台从入门到实战教程
分布式·云原生
中电金信26 分钟前
中电金信助力200+金融机构同步迁移SWIFT ISO20022标准
大数据·人工智能
山沐与山1 小时前
【Flink】Flink编程模型:DataStream与DataSet
大数据·flink
面向Google编程1 小时前
Flink源码阅读:如何生成ExecutionGraph
大数据·flink
一起养小猫1 小时前
【贡献经历】从零到贡献者:我的Kurator开源社区参与之旅
分布式·物联网·云原生·开源·华为云·istio·kurator
2501_940198691 小时前
【前瞻创想】Kurator云原生实战:从入门到精通,打造分布式云原生新生态
分布式·云原生
飞凌嵌入式1 小时前
AIoT出海背景下,嵌入式主控的国际认证之路与价值思考
大数据·人工智能·嵌入式硬件·区块链·嵌入式