sparksql的SQL风格编程

我们前面的文章介绍了DSL风格的编程,现在介绍以下两种编程风格之一的sql风格编程。

sql风格编程简介

sql风格编程就是我们可以通过spark.sql来执行sql语句进行查询,这时的DataFrame就像是一张关系型数据表。返回的是DataFrame。

如果我们想用sql风格的编程,需要先将DataFrame注册成表,注册表的方式有以下3种:

go 复制代码
# 注册临时表
df.createTempView("score")
# 注册临时表,如果存在则替换
df.createOrReplaceTempView("score")
# 注册全局表
df.createGlobalTempview("score")

值得注意的是,全局表是可以跨sparksession对象使用的,在一个程序内,多个sparksession对象都可以使用,临时表只能在当前的sparksession中使用,全局表的查询需带上前缀global_temp.xxx

将dataframe注册成表之后就可以用sql语句来查询了

python 复制代码
spark.sql("SELECT subject, COUNT(*) AS cnt FROM score GROUP BY subject").show()
相关推荐
薛定谔的猫66661 小时前
主流电商平台营销中大数据的应用◆
大数据·数据采集·淘宝天猫·电商api·主流平台·阿里巴巴1688·独立站系统
迅狐源码工厂1 小时前
如何选择快手矩阵系统:打造高效短视频营销的指南
大数据·人工智能·矩阵
GSDjisidi2 小时前
日本IT-SIER/SES的区别详情、契约形态等
java·大数据·c语言·c++·php
小的~~2 小时前
大数据面试题之Flink(4)
大数据·flink
大舍传媒3 小时前
欧美海外媒体发稿,国外新闻发布,外媒发布
大数据·人工智能·游戏引擎·信息与通信·用户运营
meitiyaoyue3 小时前
「媒体邀约」全国巡演,多地推介会,如何做好媒体宣传
大数据
samLi06203 小时前
绿色金融相关数据合集(2007-2024年 具体看数据类型)
大数据
85程序员老王4 小时前
Spark SQL----内置函数Array Functions
大数据·分布式·sql·spark·apache
WoShop商城源码4 小时前
短视频电商源码的优势及软件架构解析
大数据·教育电商
大数据小朋友4 小时前
Flume工具详解
大数据·flume