Azure Data Factory (ADF)‌ 之databricks使用

目录

一、背景

二、实操

1.传变量

2.传参数


一、背景

实现目标:adf变量及参数传送到databricks使用

二、实操

1.传变量

(1).adf里新建管道,新建【设置变量】

示例:

设置管道变量

biz_date:@{addDays(convertFromUtc(utcNow(), 'China Standard Time'),-1,'yyyyMMdd')}

biz_date_new:@{addDays(convertFromUtc(utcNow(), 'China Standard Time'),-1,'yyyy-MM-dd')}

(2).插入【笔记本】

配置服务

设置中添加笔记本路径

配置基参数

biz_date:@variables('biz_date)

biz_date_new::@variables('biz_date_new')

databricks【笔记本】-【sql】组件中直接使用变量即可

sql 复制代码
select '${biz_date}';
select '${biz_date_new}'

2.传参数

新建参数

新建notebook

配置服务

设置笔记本路径

设置基参数

biz_date:@pipeline().parameters.biz_date

databricks【笔记本】-【python】组件使用参数

python 复制代码
# 1. 接收来自 ADF 的变量
biz_date = dbutils.widgets.get("biz_date")

# 2. 
sql_query = f"""
    SELECT count(*) as total_count 
    FROM table_name
    WHERE biz_date = '{biz_date}' 
"""

# 3. 执行 SQL 并获取结果
# .collect()[0][0] 表示取第一行第一列的值
result_df = spark.sql(sql_query)
count_value = result_df.collect()[0][0]

# 4. 返回给 ADF
dbutils.notebook.exit(str(count_value))
相关推荐
Assby23 分钟前
从 Function Calling 到 MCP:理解 Agent 工具调用的底层通信机制
人工智能·后端
打字机v30 分钟前
创建第一个spring-boot项目
后端
像我这样帅的人丶你还30 分钟前
Java 后端详解(三):全局异常处理与 JPA 数据库映射
java·后端
前端Hardy38 分钟前
又一个 AI 神器火了!
前端·javascript·后端
神奇小汤圆1 小时前
面试被问烂的Java虚拟机调优,我用一个实战案例给你讲得明明白白
后端
明月_清风2 小时前
开发者网络概念全扫盲:一篇搞定
后端·网络协议
明月_清风2 小时前
零信任入门:从"城堡护城河"到"每次进门都要刷卡"
后端
站大爷IP3 小时前
Python循环中修改字典键导致遍历异常深度解析实战案例
后端
掘金者阿豪6 小时前
高可用读写分离实战(二):我把数据库主库停了,结果整个集群的反应和我想象的不一样
后端