Spark云计算平台Databricks使用,SQL

创建workspace:Spark云计算平台Databricks使用,创建workspace和Compute计算集群(Spark集群)-CSDN博客

1 创建schema

选择Calalog,点击Create schema

输入名字,Storage location选择workspace,数据都是保存在AWS S3云存储

2 创建Table

选择test,Create -> Create table

点击browse,本地上传people.json文件

bash 复制代码
[
    {"name":"Michael", "age":28},
    {"name":"Andy", "age":30},
    {"name":"Justin", "age":19}
]

点击Create table

创建成功

3 SQL

4 scala查询Table

如何运行Scala程序:Spark云计算平台Databricks使用,第一个scala程序-CSDN博客

Scala代码

Scala 复制代码
var sqlDF = spark.sql("SELECT * FROM test.people")
sqlDF.show()

运行

相关推荐
Data跳动25 分钟前
Spark内存都消耗在哪里了?
大数据·分布式·spark
woshiabc1111 小时前
windows安装Elasticsearch及增删改查操作
大数据·elasticsearch·搜索引擎
lucky_syq2 小时前
Saprk和Flink的区别
大数据·flink
lucky_syq2 小时前
流式处理,为什么Flink比Spark Streaming好?
大数据·flink·spark
袋鼠云数栈2 小时前
深入浅出Flink CEP丨如何通过Flink SQL作业动态更新Flink CEP作业
大数据
小白学大数据3 小时前
如何使用Selenium处理JavaScript动态加载的内容?
大数据·javascript·爬虫·selenium·测试工具
15年网络推广青哥3 小时前
国际抖音TikTok矩阵运营的关键要素有哪些?
大数据·人工智能·矩阵
木子Linux4 小时前
【Linux打怪升级记 | 问题01】安装Linux系统忘记设置时区怎么办?3个方法教你回到东八区
linux·运维·服务器·centos·云计算
节点。csn4 小时前
Hadoop yarn安装
大数据·hadoop·分布式
arnold664 小时前
探索 ElasticSearch:性能优化之道
大数据·elasticsearch·性能优化