Spark系列之：使用spark合并hive数据库多个分区的数据到一个分区中

最笨的羊羊2023-12-23 21:06

Spark系列之：使用spark合并hive数据库多个分区的数据到一个分区中

把两个分区的数据合并到同一个分区下
把其中一个分区的数据通过append方式添加到另一个分区即可

scala 复制代码

%spark
val df = spark.sql("select * from optics_prod.product_1h_a where datetime='2023111423'")
    .repartition(10)
    .write.mode("append")
    .parquet("/optics-prod/dwh/ods/optics/product_1h_a/datetime=2023112223")

上一篇：从零开发短视频电商在AWS上SageMaker部署模型自定义日志输入和输出示例

下一篇：【QT表格-6】QTableWidget的currentCellChanged实现中途撤销