Microsoft Fabric - 尝试一下Delta Table

1. 简单介绍

Microsoft Fabirc中的Delta table是一种适用于Spark的关系存储层,是一种基于Parquet文件的Table。这边尝试一下在Microsoft Fabric Delta table。

2.具体说明

2.1 创建Lakehouse

  1. 点击workspace中的New item
  1. 点击Lakehouse选项,创建一个Lakehouse
  1. 创建一个subfolder并导入OlympicsMetalsData.csv文件

2.2 创建Notebook

  1. 点击New notebook 菜单项创建一个notebook
  1. 显示一下OlympicsMetalsData.csv文件的数据
复制代码
df = spark.read.format("csv").option("header","true").load("Files/OlympicsData/OlympcisMetalsData.csv")
display(df)

2.3 创建一个托管的Table

复制代码
df.write.format("delta").saveAsTable("managed_olympicsmetalsdata")

发现Lakehouse确实有一个table managed_olympicsmetalsdata 生成

2.4 创建一个External table

点击Files文件夹右边的...,选择Copy ABFS path

下面是在Notebook中执行的语句, 其中your copied ABFS path是copy出来的ABFS path,

复制代码
df.write.format("delta").saveAsTable("external_olympicsmetalsdata", path="[your copied ABFS path]/external_olympicsmetalsdata")

执行创建external table的语句,刷新Lakehouse的Tables和Files文件夹,发现Lakehouse的有对应的external table(external_olympicsmetalsdata)产生,同时也产生了一个文件夹external_olympicsmetalsdata,文件夹下面是数据文件

2.5 Drop Table

执行下面的SQL语句,删除前两步骤中创建的托管和external table

2.6 托管和external Table的不同

刷新Lakehouse的Tables文件夹,发现之前创建的两个table已经被drop了

但是external table external_olympicsmetalsdata对应的外部数据文件还存在

依然可以通过外部的数据文件进行Delta table的创建,如下图

刷新Lakehouse,发现delta table有创建好

同时执行查询delta table的语句,也可以把奥运会的数据查询出来

3.总结

本文简单记录了一下在Microsoft Fabric Spark中使用Delta Table的一些过程,Microsoft Fabric的内容体系非常庞大,同时新的feature更新得也很快,还需继续向Microsoft Fabric专家们学习一下。

本文如果哪里有错误,麻烦告之,谢谢谢谢!

相关推荐
网络研究院8 小时前
即将过期的安全启动证书将如何影响 Windows 设备
安全·微软·系统·漏洞·硬件
我是一颗柠檬8 小时前
【Redis】事务与Lua脚本Day7(2026年)
数据库·redis·后端·lua·database
刘欣的博客9 小时前
LiteNetLib WinForm Demo
数据库·microsoft·c#
DisonTangor10 小时前
微软重磅开源 Lens: 重新思考基础文本到图像模型的训练效率
人工智能·microsoft·ai作画·开源·aigc
小白学大数据13 小时前
业务落地:Python 列表在 AI 接口开发中的实战应用
人工智能·爬虫·python·microsoft
酿情师1 天前
Microsoft Visual C++ Build Tools 2026 下载与安装指南(Windows)
c++·windows·microsoft
宝桥南山1 天前
Microsoft Agent Framework(MAF) - 如何将workflow或者A2A client转换成一个AI Agent
microsoft·ai·微软·aigc·.net·.netcore
ylscode2 天前
微软发布针对 Windows 11 的 KB5089573 补丁,以修复“周二补丁日”安装问题
windows·安全·microsoft·安全威胁分析
我是一颗柠檬2 天前
【Redis】持久化机制Day6(2026年)
数据库·redis·后端·缓存·database
我是一颗柠檬2 天前
【MySQL全面教学】MySQL性能优化实战Day13(2026年)
数据库·后端·sql·mysql·性能优化·database