spark广播变量

2024-1-24

广播变量特点

  • Broadcast Variable会将使用到的变量,只会为每个节点拷贝一份,不会为每个task进行拷贝,能够优化性能(在task数量比较大体现更明显),减少网络传输及内存消耗
  • 通过SparkContext的broadcast()方法,针对某个变量创建广播变量,可以通过广播变量的value()方法获取值
  • 广播变量是只读
Scala 复制代码
object BroadcastTest {

  def main(args: Array[String]): Unit = {
    val conf: SparkConf = new SparkConf().setAppName("Broadcast").setMaster("local")
    val sc = new SparkContext(conf)
    sc.setLogLevel("ERROR")
    val listRDD: RDD[Int] = sc.parallelize(List(1, 2, 3, 4))
    var num = 2
    val bc: Broadcast[Int] = sc.broadcast(num)
    listRDD.map(x=> x * bc.value).foreach(println)
  }
}
相关推荐
wzl202612133 小时前
基于企微API与数据中台,构建用户分层与沉默用户召回体系
大数据·人工智能·企业微信
姓蔡小朋友3 小时前
RabbitMQ
分布式·rabbitmq
币之互联万物3 小时前
好用的推理训练引擎:博云AIOS如何重塑企业AI算力底座
大数据·人工智能
深蓝轨迹3 小时前
Redis 分布式锁实现流程
数据库·redis·分布式
从零开始学习人工智能3 小时前
从PDF到智能问答:RAG-Anything多模态银行文档处理实战解析
大数据·人工智能·pdf
jkyy20143 小时前
破解零售增长瓶颈,AI智能营养师成为保健品成交新引擎
大数据·人工智能·健康医疗·零售
阳光普照世界和平3 小时前
借力大模型,重构研发效能:全流程提效实战指南
大数据·人工智能·重构
威联通安全存储3 小时前
深度观察:跨越“存起来”的误区,智造时代如何重构工业数据底座?
大数据·人工智能·python·重构
Elastic 中国社区官方博客4 小时前
使用 Elasticsearch Inference API 结合 Hugging Face 模型
大数据·人工智能·elasticsearch·搜索引擎·ai·全文检索
2501_921649494 小时前
外汇实时汇率 API | 24 小时 架构设计与实战指南
大数据·python·websocket·金融·restful