【spark（零）】spark技术概览

roman_日积跬步-终至千里2024-05-11 13:29

文章目录

[一. Spark入门](#一. Spark入门)
[二. Spark RDD与 Spark core](#二. Spark RDD与 Spark core)
[三. Spark SQL](#三. Spark SQL)
[四. Spark Streaming](#四. Spark Streaming)
[五. Spark内核原理](#五. Spark内核原理)

一. Spark入门

Spark基础知识

Spark部署模式、

Spark运行流程

【概述】spark（一）:spark特点、知识范畴、spark架构、任务提交流程、支持哪些运行环境

二. Spark RDD与 Spark core

RDD基础

常用的RDD算子

RDD函数传递

RDD依赖关系

RDD缓存与检查点

数据的存储与读取

RDD编程进阶

【理论】（spark 二）spark core之RDD：基础概念、特点、stage任务划分与hello spark

【算子1】spark（三）：spark core：trans算子中value类型的算子使用说明

【算子2】spark（四）：spark core：trans算子中key-value类型的算子使用说明

【算子3】spark（五）：spark core：控制算子（cache、persist）、action算子和检查点

【变量】spark（六）变量共享：累加器和广播变量

三. Spark SQL

Spark SQL基础

Spark SQL创建

RDD DataFrame DataSet转换

IDEA创建Spark SQL程序

用户自定义函数

Spark SQL数据源

【spark sql】spark（八）sparkSQL概述：dataFrame、DataSet、UDF、SparkSQL数据源

四. Spark Streaming

基本介绍

WordCount案例实操

DStream创建

从Kafka中采集数据

DStream转换

window函数

【spark streaming】spark（九）Spark Streaming Programming Guide：概述、wordcount、数据源、trans（常见算子、window）、输出源

五. Spark内核原理

【shuffle/内存模型】spark（七）超详细mareduce shuffle和spark Shuffle讲解、以及spark比mapreduce快在哪些方面

上一篇：OceanBase OAT安装

下一篇：Flume 的安装和使用方法(Spark-2.1.0)

热门推荐

012026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 02GitHub 镜像站点 03如何新建文件夹？电脑新建文件夹的4种方法 04幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 05AI科技热点日报 | 2026年07月01日 06国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 082026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？09微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 10Kimi K3 真实体验：全网评价整理，优缺点一次性说清楚