Spark云计算平台Databricks使用,SQL

创建workspace:Spark云计算平台Databricks使用,创建workspace和Compute计算集群(Spark集群)-CSDN博客

1 创建schema

选择Calalog,点击Create schema

输入名字,Storage location选择workspace,数据都是保存在AWS S3云存储

2 创建Table

选择test,Create -> Create table

点击browse,本地上传people.json文件

bash 复制代码
[
    {"name":"Michael", "age":28},
    {"name":"Andy", "age":30},
    {"name":"Justin", "age":19}
]

点击Create table

创建成功

3 SQL

4 scala查询Table

如何运行Scala程序:Spark云计算平台Databricks使用,第一个scala程序-CSDN博客

Scala代码

Scala 复制代码
var sqlDF = spark.sql("SELECT * FROM test.people")
sqlDF.show()

运行

相关推荐
Huaqiwill38 分钟前
Ubuntun搭建并行计算环境
linux·云计算
为什么这亚子2 小时前
九、Go语言快速入门之map
运维·开发语言·后端·算法·云原生·golang·云计算
拓端研究室TRL2 小时前
【梯度提升专题】XGBoost、Adaboost、CatBoost预测合集:抗乳腺癌药物优化、信贷风控、比特币应用|附数据代码...
大数据
黄焖鸡能干四碗2 小时前
信息化运维方案,实施方案,开发方案,信息中心安全运维资料(软件资料word)
大数据·人工智能·软件需求·设计规范·规格说明书
划水小将军2 小时前
阿里云函数计算GBK编码
阿里云·云计算
编码小袁2 小时前
探索数据科学与大数据技术专业本科生的广阔就业前景
大数据
WeeJot嵌入式3 小时前
大数据治理:确保数据的可持续性和价值
大数据
沈艺强3 小时前
云计算答案
云计算
zmd-zk4 小时前
kafka+zookeeper的搭建
大数据·分布式·zookeeper·中间件·kafka
激流丶4 小时前
【Kafka 实战】如何解决Kafka Topic数量过多带来的性能问题?
java·大数据·kafka·topic