Spark SQL将Hive表中的数据写入到MySQL数据库中

Scala 复制代码
import org.apache.spark.sql.SparkSession

object HiveToMySQL {
  def main(args: Array[String]): Unit = {
    // 创建SparkSession
    val spark = SparkSession.builder()
      .appName("HiveToMySQL")
      .enableHiveSupport()
      .getOrCreate()

    // 读取Hive表数据
    val hiveDF = spark.table("hive_table_name")

    // 写入MySQL表
    hiveDF.write
      .format("jdbc")
      .option("url", "jdbc:mysql://localhost:3306/database_name")
      .option("dbtable", "mysql_table_name")
      .option("user", "mysql_username")
      .option("password", "mysql_password")
      .save()
    
    // 关闭SparkSession
    spark.stop()
  }
}
  • "hive_table_name":Hive表的名称。
  • "jdbc:mysql://localhost:3306/database_name":MySQL数据库的连接URL,包括主机名、端口号和数据库名称。
  • "mysql_table_name":要写入的MySQL表的名称。
  • "mysql_username":MySQL数据库的用户名。
  • "mysql_password":MySQL数据库的密码。

确保替换这些参数后,运行代码即可将Hive表中的数据写入到MySQL表中。

相关推荐
星哥说事13 分钟前
告警通知方式:邮件、短信、Slack、钉钉等告警通知方式的配置
数据库·钉钉
张人玉15 分钟前
c#常用的类
服务器·数据库·c#
IT 行者31 分钟前
Spring Security 7.0 迁移指南
java·数据库·spring
zhengfei6111 小时前
漏洞情报聚合与分析工具——TL-ICScan
数据库·oracle
专注API从业者1 小时前
构建企业级 1688 数据管道:商品详情 API 的分布式采集与容错设计
大数据·开发语言·数据结构·数据库·分布式
2501_924064111 小时前
2025年数据库性能压测工具对比与重点测试方案选型指南
数据库·oracle
ttthe_MOon1 小时前
Redis Cluster集群模式和各种常见问题
数据库·redis·缓存
小鸡脚来咯1 小时前
MySQL InnoDB内存结构,增删改查时怎么运行的
数据库·mysql
杨了个杨89821 小时前
PostgreSQL(pgSQL)常用操作
数据库·postgresql·oracle
蝈蝈(GuoGuo)1 小时前
SQL Server 中指定范围分页取数详解
数据库