Spark-SQL（二）

2401_824256862025-04-16 13:55

一. 利用IDEA开发Spark-SQL

1 在pop.xml中添加spark-sql依赖

2 spark-sql测试代码

1）在idea中读取json文件创建DataFrame

2）SQL风格语法

3 ）DSL风格语法

4） RDD转换成DataFrame，DataFrame转换成DataSet

5）DataSet转换成DataFrame ，DataFrame转换成 RDD

实例演示

运行结果

二自定义函数

UDF

创建SparkSession ，读取json文件

实例演示

运行结果

三 UDAF

任务需求:计算平均工资

方式一 :RDD

运行结果

方式二：弱类型UDAF

运行结果

方式三：强类型UDAF

实例演示

运行结果

上一篇：经典算法判断一个图是不是树

下一篇：函数式编程

热门推荐

01GitHub 镜像站点 02Codex 接入 DeepSeek API 完整配置文档 03CC-Switch & Claude 基于 Linux 服务器安装使用指南 04【AI】2026 年具身智能模型和世界模型总结 05零基础教你claude code 接入 deepseek V4 06AI科技热点日报 | 2026年5月11日 07人工智能最新动态 AI 日报 · 2026年5月10日 08codex app每次打开重连5次Reconnecting问题解决 09Gemini大升级、AI眼镜首发、Android XR亮相，13天后见分晓 10Cursor 接入 DeepSeek‑V4‑Pro 完整指南（2026 实测）