【spark(零)】spark技术概览

文章目录

  • [一. Spark入门](#一. Spark入门)
  • [二. Spark RDD与 Spark core](#二. Spark RDD与 Spark core)
  • [三. Spark SQL](#三. Spark SQL)
  • [四. Spark Streaming](#四. Spark Streaming)
  • [五. Spark内核原理](#五. Spark内核原理)

一. Spark入门

Spark基础知识

Spark部署模式、

Spark运行流程

【概述】spark(一):spark特点、知识范畴、spark架构、任务提交流程、支持哪些运行环境

二. Spark RDD与 Spark core

RDD基础

常用的RDD算子

RDD函数传递

RDD依赖关系

RDD缓存与检查点

数据的存储与读取

RDD编程进阶

【理论】(spark 二)spark core之RDD:基础概念、特点、stage任务划分与hello spark

【算子1】spark(三):spark core:trans算子中value类型的算子使用说明

【算子2】spark(四):spark core:trans算子中key-value类型的算子使用说明

【算子3】spark(五):spark core:控制算子(cache、persist)、action算子和检查点

【变量】spark(六)变量共享:累加器和广播变量

三. Spark SQL

Spark SQL基础

Spark SQL创建

RDD DataFrame DataSet转换

IDEA创建Spark SQL程序

用户自定义函数

Spark SQL数据源

【spark sql】spark(八)sparkSQL概述:dataFrame、DataSet、UDF、SparkSQL数据源

四. Spark Streaming

基本介绍

WordCount案例实操

DStream创建

从Kafka中采集数据

DStream转换

window函数

【spark streaming】spark(九)Spark Streaming Programming Guide:概述、wordcount、数据源、trans(常见算子、window)、输出源

五. Spark内核原理

【shuffle/内存模型】spark(七)超详细mareduce shuffle和spark Shuffle讲解、以及spark比mapreduce快在哪些方面

相关推荐
逸模1 小时前
告别熬夜手工整理台账,逸模智能归集实现项目数据自动化存档
大数据·运维·人工智能·笔记·其他·信息可视化·自动化
audyxiao0013 小时前
ICLR 2026论文分享 | WorldGym:用世界模型打造机器人策略评估新范式
大数据·人工智能·大模型·智能体·世界模型
giaz14n9X3 小时前
Redis 分布式锁进阶第五十七篇
数据库·redis·分布式
Rubin智造社4 小时前
Anthropic安全白皮书2|三级成熟度模型:你的AI智能体该配哪级安全?
大数据·安全·沙箱隔离·零信任成熟度模型·三级安全框架·jit权限·不可变审计
WyCAGy8ij4 小时前
Redis 分布式锁进阶第二篇讲解
数据库·redis·分布式
ACP广源盛139246256734 小时前
GSV2221 显示转换芯片@ACP#赋能 RTX Spark 端侧 AI 设备,构建多屏全模态视觉交互新生态
大数据·人工智能·嵌入式硬件·gpt·spark·电脑·音视频
字节跳动开源4 小时前
你的 Agent 每次都“失忆”?这个工具彻底治好了我的前端开发焦虑
大数据·开源·agent
APItesterCris6 小时前
实战教程:借助 Open Claw + 淘宝商品 API,低成本实现电商自动化监控与智能选品
大数据·运维·自动化
团象科技6 小时前
从一线运营场景观察 海外云 独立站的跨境效能释放实践路径
大数据·人工智能
宸津-代码粉碎机6 小时前
Spring AI企业级实战|从RAG优化到Agent多工具调度
java·大数据·人工智能·后端·python·spring