【spark(零)】spark技术概览

文章目录

  • [一. Spark入门](#一. Spark入门)
  • [二. Spark RDD与 Spark core](#二. Spark RDD与 Spark core)
  • [三. Spark SQL](#三. Spark SQL)
  • [四. Spark Streaming](#四. Spark Streaming)
  • [五. Spark内核原理](#五. Spark内核原理)

一. Spark入门

Spark基础知识

Spark部署模式、

Spark运行流程

【概述】spark(一):spark特点、知识范畴、spark架构、任务提交流程、支持哪些运行环境

二. Spark RDD与 Spark core

RDD基础

常用的RDD算子

RDD函数传递

RDD依赖关系

RDD缓存与检查点

数据的存储与读取

RDD编程进阶

【理论】(spark 二)spark core之RDD:基础概念、特点、stage任务划分与hello spark

【算子1】spark(三):spark core:trans算子中value类型的算子使用说明

【算子2】spark(四):spark core:trans算子中key-value类型的算子使用说明

【算子3】spark(五):spark core:控制算子(cache、persist)、action算子和检查点

【变量】spark(六)变量共享:累加器和广播变量

三. Spark SQL

Spark SQL基础

Spark SQL创建

RDD DataFrame DataSet转换

IDEA创建Spark SQL程序

用户自定义函数

Spark SQL数据源

【spark sql】spark(八)sparkSQL概述:dataFrame、DataSet、UDF、SparkSQL数据源

四. Spark Streaming

基本介绍

WordCount案例实操

DStream创建

从Kafka中采集数据

DStream转换

window函数

【spark streaming】spark(九)Spark Streaming Programming Guide:概述、wordcount、数据源、trans(常见算子、window)、输出源

五. Spark内核原理

【shuffle/内存模型】spark(七)超详细mareduce shuffle和spark Shuffle讲解、以及spark比mapreduce快在哪些方面

相关推荐
AORO_BEIDOU1 小时前
抢抓5G机遇,AORO A23防爆手机如何直击园区巡检挑战?
大数据·5g·智能手机·信息与通信
Shaidou_Data1 小时前
信息技术引领未来:大数据治理的实践与挑战
大数据·人工智能·数据清洗·信息技术·数据治理技术
Elastic 中国社区官方博客1 小时前
开始使用 Elastic AI Assistant 进行可观察性和 Microsoft Azure OpenAI
大数据·人工智能·elasticsearch·microsoft·搜索引擎·全文检索·azure
青云交1 小时前
大数据新视界 -- 大数据大厂之 Impala 性能优化:新技术融合的无限可能(下)(12/30)
大数据·性能优化·impala·技术创新·新技术融合·电商案例·跨行业应用
weixin_442643421 小时前
FileLink跨网文件安全摆渡系统——企业数据流转的安全桥梁
大数据·网络·安全·filelink文件摆渡系统
OBOO鸥柏2 小时前
OBOO鸥柏“触摸屏广告一体机交互”亮相2024中国珠海航展
大数据·人工智能·科技·交互
2401_857636392 小时前
实时数据流的革命:分布式数据库的挑战与实践
数据库·分布式
scc21403 小时前
kafka中topic的数据抽取不到hdfs上问题解决
分布式·hdfs·kafka
青春不流名3 小时前
kafka日志清理配置
spark
我是琦琦琦琦3 小时前
flink 同步oracle11g数据表到pg库
大数据·postgresql·oracle·flink