Spark 的Driver程序中定义的外部变量或连接为什么不能在各种算在中直接用，如果要要如何做？

小湘西2024-02-04 11:25

在Driver程序中定义的外部变量或连接不能在算子中直接使用，因为它们不会被序列化并发送到各个Executor。如果需要在算子使用外部资源，应该在算子内部初始化这些资源。

例如，将RDD数据写入数据库可以这样实现：

Scala 复制代码

rdd.foreach(record => {
  // 在这里初始化数据库连接
  val connection = createNewConnection() // 假设这是创建连接的函数
  connection.send(record) // 发送记录到数据库
  connection.close() // 关闭连接
})

上一篇：探究 MySQL 中使用 where 1=1 是否存在性能影响

下一篇：VS+QT 配置Eigen库