sparksql的SQL风格编程

我们前面的文章介绍了DSL风格的编程,现在介绍以下两种编程风格之一的sql风格编程。

sql风格编程简介

sql风格编程就是我们可以通过spark.sql来执行sql语句进行查询,这时的DataFrame就像是一张关系型数据表。返回的是DataFrame。

如果我们想用sql风格的编程,需要先将DataFrame注册成表,注册表的方式有以下3种:

go 复制代码
# 注册临时表
df.createTempView("score")
# 注册临时表,如果存在则替换
df.createOrReplaceTempView("score")
# 注册全局表
df.createGlobalTempview("score")

值得注意的是,全局表是可以跨sparksession对象使用的,在一个程序内,多个sparksession对象都可以使用,临时表只能在当前的sparksession中使用,全局表的查询需带上前缀global_temp.xxx

将dataframe注册成表之后就可以用sql语句来查询了

python 复制代码
spark.sql("SELECT subject, COUNT(*) AS cnt FROM score GROUP BY subject").show()
相关推荐
百锦再5 分钟前
时序数据库选型指南:大数据时代的“数据基建”与 IoTDB 的工业原生之路
大数据·数据库·mysql·oracle·sqlserver·时序数据库·iotdb
有想法的py工程师5 分钟前
如何用 AWS CLI 判断 T 系列实例 CPU 不够(实战指南)
大数据·aws
weikecms6 分钟前
2026企微SCRM社群管理工具推荐
大数据·人工智能
前端若水9 分钟前
Git 全命令超级详细指南
大数据·git·elasticsearch
末代程序员_C15 分钟前
Maven版本管控:多分支并行开发中的API版本管理之道
大数据·elasticsearch·maven
Omics Pro19 分钟前
癌症亚型分类新型多组学整合框架
大数据·人工智能·python·算法·机器学习·分类·数据挖掘
dingzd9527 分钟前
视频创作工具持续升级跨境社媒内容生产流程如何做轻量化
大数据·人工智能·新媒体运营·市场营销·跨境
GlobalInfo31 分钟前
2026年喷涂机器人行业市场调查与投资建议分析
大数据·人工智能·机器人
Jason_zhao_MR35 分钟前
基于米尔RK3576核心板的国产割草机器人解决方案
大数据·linux·人工智能·单片机·物联网·机器人·嵌入式
蓉蓉的数码视界36 分钟前
则成电子26年一季报:AI+汽车电子双轮驱动成效显著,营收增长26.68%
大数据·人工智能·汽车