Azure Data Factory (ADF)‌ 之databricks使用

目录

一、背景

二、实操

1.传变量

2.传参数


一、背景

实现目标:adf变量及参数传送到databricks使用

二、实操

1.传变量

(1).adf里新建管道,新建【设置变量】

示例:

设置管道变量

biz_date:@{addDays(convertFromUtc(utcNow(), 'China Standard Time'),-1,'yyyyMMdd')}

biz_date_new:@{addDays(convertFromUtc(utcNow(), 'China Standard Time'),-1,'yyyy-MM-dd')}

(2).插入【笔记本】

配置服务

设置中添加笔记本路径

配置基参数

biz_date:@variables('biz_date)

biz_date_new::@variables('biz_date_new')

databricks【笔记本】-【sql】组件中直接使用变量即可

sql 复制代码
select '${biz_date}';
select '${biz_date_new}'

2.传参数

新建参数

新建notebook

配置服务

设置笔记本路径

设置基参数

biz_date:@pipeline().parameters.biz_date

databricks【笔记本】-【python】组件使用参数

python 复制代码
# 1. 接收来自 ADF 的变量
biz_date = dbutils.widgets.get("biz_date")

# 2. 
sql_query = f"""
    SELECT count(*) as total_count 
    FROM table_name
    WHERE biz_date = '{biz_date}' 
"""

# 3. 执行 SQL 并获取结果
# .collect()[0][0] 表示取第一行第一列的值
result_df = spark.sql(sql_query)
count_value = result_df.collect()[0][0]

# 4. 返回给 ADF
dbutils.notebook.exit(str(count_value))
相关推荐
ふり1 小时前
测试的“三重境界”:黑盒、白盒、灰盒的对比与实践
网络·python·测试工具·需求分析
喵个咪1 小时前
技术复盘:基于 GoWind Admin 实现 Kratos 框架单体轻量化落地
后端·架构·go
开源量化GO1 小时前
多合约期货策略目标持仓怎么更新不容易乱
python·区块链
星栈独行1 小时前
Makepad、egui、Dioxus、Tauri:Rust GUI 到底怎么选
开发语言·后端·程序人生·ui·rust
cfm_29141 小时前
SpringBoot整合RocketMQ极速实战
java·spring boot·后端
Sylvia33.2 小时前
2026世界杯全套数据API接入教程:WebSocket实时进球推送实例
java·网络·python·websocket·网络协议
zyl837212 小时前
Python 线性代数:矩阵与向量
开发语言·python·机器学习
liuqun03192 小时前
怎么设置单个项目设置局部的git user.name
git·后端
金銀銅鐵2 小时前
用 Tkinter 实现一个简单的干支纪年计算器
后端·python