Microsoft Fabric - 尝试一下使用On Premiums data gateway从本地Sql Server同步数据到Lakehouse

1.简单介绍

Microsoft Fabric也可以使用On-Premiums data gateway从本地的数据源同步数据。On-Premiums data gateway既可以用于Power Automate, Power BI,现在也可以用于Microsoft Fabric中。这个feature在2024年9月general available了。感觉Microsoft Fabric的feature更新很快,同时Copilot在微软的很多产品中(包括Microsoft Fabric)集成速度也特别快。

这边尝试一下使用On Premiums Data Gateway从本地SQL Server数据库同步数据到Microsoft Fabric的Lakehouse中,以Copy Job的形式来运行的。

2.具体说明

假定本地SQL Server数据库中有2024年的巴黎奥运会的数据,如下图

现在要将这份数据从本地同步到Microsoft Fabric中

2.1 安装Data Gateway

On-Premiums Data Gateway的安装文件可以从这个地址进行下载的

如果C盘的剩余空间小于4G,安装会失败的

1)点击安装文件,开始安装

2)设置安装的路径,然后点击Install

  1. 输入一个Microsoft 的工作和学校帐户,然后点击Sign In进行身份认证

4)可以选择第一个选项 Register a new gateway on this computer进行Data Gateway的创建

5)设置Data Gateway的名字以及Recovery key,然后点击Configure

  1. 最后如果出现如下的窗口,表示安装成功了

2.2 配置Data Gateway的连接

在Microsoft Fabric中创建一个Data Gageway connection,这样所有的workspace中的Dataflow, Data Pipeline, Azure Data Factory等可以共用一个connection

  1. 点击Microsoft Fabric右上角的齿轮图标
  1. 点击弹出的右侧面板中的 Manage connections and gateways 链接
  1. 导航到如下界面中创建一个connection

这边在进入到下面的界面时候,发现已经有一个connection在那里了,可能前面的步骤会自动初始化一个Data Gateway connection

2.3 创建Copy Job(Full Copy)

这边打算创建两个Copy Job,第一个是全量数据同步的Copy Job,第二个是增量同步的Copy Job

在Microsoft Fabric中点击New Item,

  1. 点击 Copy job选项

3)配置Copy job的名字

4)输入本地SQL Server数据库的具体的connection信息,比如servername, database name, 帐户和密码等信息,如下图所示。最后点击Next按钮

5)选择要同步的源数据table

  1. 配置同步数据的目标Lakehouse

点击Lakehouse选项,会弹出New lakehouse窗口,然后输入一下lakehouse的名字,最后点击Create and connect

  1. 配置源数据table和目标的mapping
  1. 数据同步设定为Full Copy
  1. 最后点击Review界面中的Save+Run按钮,如下图

10)在Copy Job的运行界面中,这边等待80秒,可以看到数据同步完成了

11)打开目标Lakehouse,数据确实已经同步对应的table中了

2.4 创建Copy Job(Incremental)

现在打算修改以下源数据table的奥运会数据,比如改一下如下的数值

要实现增量的数据同步,这边再创建一个增量同步的Copy Job,

  1. 点击Copy job选项,如下图
  1. 配置New copy job的名字,然后点击Create按钮

3)配置本地SQL SERVER数据库的连接

  1. 还是选择和全量同步Copy Job一样的源数据table,如下图

5)选择和全量Copy Job一样的目标lakehouse

  1. 数据同步的方式这次选择Incremental copy,然后Incremental column选择No
  1. 在Review界面中可以配置Copy job的Schedule的信息,如下图。

8)配置好schedule后,点击右下角的Save+Run按钮进行运行

9)在Copy Job运行界面中,这边等待了52秒,Incremental copy运行成功,

  1. 最后检查数据,发现目标lakehouse种特定的数值也进行了更新了,

3.总结

本文记录了一下Microsoft Fabric配置On-Premuims Data Gateway从本地的SQL Server中同步数据到目标lakehouse的过程,具体的细节比较多一些。当前Microsoft Fabric的功能越来越强大,新特性的更新频率非常快,知识体量很大的,后续还需继续跟着微软的老师们学习一下。

本文如果哪里有错误,麻烦告之,谢谢谢谢!

相关推荐
迎風吹頭髮19 小时前
UNIX下C语言编程与实践24-UNIX 标准文件编程库:无格式读写函数族(字符、行、块)的使用
c语言·microsoft·unix
HAORChain1 天前
Fabric 2.x 外部链码部署(External Chaincode Service)实战攻略
linux·docker·区块链·fabric
zzywxc7871 天前
大模型落地实践指南:从技术路径到企业级解决方案
java·人工智能·python·microsoft·golang·prompt
柳贯一(逆流河版)2 天前
Gateway 集成 JWT 身份认证:微服务统一认证的实战指南
微服务·架构·gateway
FreeBuf_2 天前
微软警示AI驱动的钓鱼攻击:LLM生成的SVG文件绕过邮件安全检测
人工智能·安全·microsoft
ITHAOGE152 天前
下载 | Win10 2021官方精简版,预装应用极少!(9月更新、Win 10 IoT LTSC 2021版、适合老电脑安装)
windows·科技·物联网·microsoft·微软·电脑
码界奇点2 天前
Nginx 502 Bad Gateway从 upstream 日志到 FastCGI 超时深度复盘
运维·nginx·阿里云·性能优化·gateway
半夏知半秋2 天前
基于skynet框架业务中的gateway实现分析
服务器·开发语言·后端·学习·gateway
一人の梅雨3 天前
淘宝店铺全量商品接口深度开发:从分页优化到数据完整性保障
linux·windows·microsoft
爱考证的小刘3 天前
微软MOS认证海外考生如何参加?
微软·office·微软mos认证·mos认证考试·mos·微软mos国际认证·mos考试语言