spark广播变量

2024-1-24

广播变量特点

  • Broadcast Variable会将使用到的变量,只会为每个节点拷贝一份,不会为每个task进行拷贝,能够优化性能(在task数量比较大体现更明显),减少网络传输及内存消耗
  • 通过SparkContext的broadcast()方法,针对某个变量创建广播变量,可以通过广播变量的value()方法获取值
  • 广播变量是只读
Scala 复制代码
object BroadcastTest {

  def main(args: Array[String]): Unit = {
    val conf: SparkConf = new SparkConf().setAppName("Broadcast").setMaster("local")
    val sc = new SparkContext(conf)
    sc.setLogLevel("ERROR")
    val listRDD: RDD[Int] = sc.parallelize(List(1, 2, 3, 4))
    var num = 2
    val bc: Broadcast[Int] = sc.broadcast(num)
    listRDD.map(x=> x * bc.value).foreach(println)
  }
}
相关推荐
渣渣盟20 小时前
Spark 性能调优实战:从开发到生产落地
javascript·ajax·spark
WL_Aurora20 小时前
MapReduce经典例题【第一期】
大数据·mapreduce
Datakeji20 小时前
维恩波特Vairnport商业逻辑
大数据·人工智能·区块链
尚医云·云HIS20 小时前
从“21粒”误开,看AI如何补位处方安全
大数据·人工智能·健康医疗
摇滚侠21 小时前
黑马 Elasticsearch 全套教程,黑马旅游网案例
大数据·elasticsearch·jenkins
KmSH8umpK21 小时前
SpringBoot 分布式锁实战:从单机锁到Redis分布式锁全覆盖,解决超卖、重复下单、幂等并发问题
spring boot·redis·分布式
m0_380167141 天前
清算热力图怎么看?如何用来判断行情走向
大数据·人工智能·区块链
消失的旧时光-19431 天前
线程池解决了什么?为什么还不够?(从线程到协程 · 第2篇)
java·大数据·数据库
AI周红伟1 天前
周红伟:AI时代,苹果还行吗?
大数据·人工智能·安全·copilot·openclaw
醉颜凉1 天前
Elasticsearch 安全组件详解:Search Guard 和 X-Pack Security 到底有什么区别?
大数据·安全·elasticsearch