sparksql的SQL风格编程

我们前面的文章介绍了DSL风格的编程,现在介绍以下两种编程风格之一的sql风格编程。

sql风格编程简介

sql风格编程就是我们可以通过spark.sql来执行sql语句进行查询,这时的DataFrame就像是一张关系型数据表。返回的是DataFrame。

如果我们想用sql风格的编程,需要先将DataFrame注册成表,注册表的方式有以下3种:

go 复制代码
# 注册临时表
df.createTempView("score")
# 注册临时表,如果存在则替换
df.createOrReplaceTempView("score")
# 注册全局表
df.createGlobalTempview("score")

值得注意的是,全局表是可以跨sparksession对象使用的,在一个程序内,多个sparksession对象都可以使用,临时表只能在当前的sparksession中使用,全局表的查询需带上前缀global_temp.xxx

将dataframe注册成表之后就可以用sql语句来查询了

python 复制代码
spark.sql("SELECT subject, COUNT(*) AS cnt FROM score GROUP BY subject").show()
相关推荐
AI智图坊3 分钟前
电商详情页转化率提升实战:基于AI的“卖点-视觉”转化链路设计与自动化实现
大数据·运维·人工智能·gpt·ai作画·自动化·aigc
chushiyunen6 分钟前
elasticsearch查询相关
大数据·elasticsearch·搜索引擎
段一凡-华北理工大学19 分钟前
工业领域的Hadoop架构学习~系列文章16:实时流处理架构 - 工业数据的实时动脉
大数据·数据仓库·hadoop·分布式·学习·架构·高炉炼铁
yyuuuzz24 分钟前
aws亚马逊云服务的基础认知与常见场景
大数据·运维·服务器·网络·云计算·aws
Data-Miner28 分钟前
休闲食品数据分析平台建设方案,70页ppt全解析
大数据·人工智能·数据分析
河北清兮网络科技30 分钟前
2026石家庄广告联盟APP开发成本明细|不同开发模式费用拆解
大数据·小程序·app·短剧app·广告联盟
Aloudata33 分钟前
宽表 vs 语义层:论 AI 时代语义编织对智能数据分析的重要性
大数据·人工智能·数据挖掘·数据分析·agent·语义层·语义编织
工业胶粘剂技术40 分钟前
工业胶粘剂选型指南:东莞科耀26款TDS型号与应用场景整理
大数据
老H科研技术1 小时前
第 02 篇:5 分钟搭建第一个 MCP 服务器
大数据·运维·服务器·人工智能·学习·aigc·ai编程
商业模式源码开发1 小时前
餐饮实体商业模式拆解:推三享一与异业联盟的合规落地架构
大数据·架构·异业联盟·私域流量·推三返一·商业观察