大数据 - Spark系列《二》- 关于Spark在Idea中的一些常用配置

上一篇:

大数据 - Spark系列《一》- 从Hadoop到Spark:大数据计算引擎的演进-CSDN博客

目录

[1. 🥙Idea中配置Live Templates来快速生成代码片段](#1. 🥙Idea中配置Live Templates来快速生成代码片段)

[2. 🥙Idea中配置文件模板自定义初始代码](#2. 🥙Idea中配置文件模板自定义初始代码)

3.🥙设置spark-submit提交程序时不在控制台打印日志信息


1. 🥙Idea中配置Live Templates来快速生成代码片段

下面是如何配置Live Templates来创建Spark对象的示例:

  1. 打开IntelliJ IDEA,转到或Settings(Windows/Linux)。

  2. 在设置对话框中,选择Editor - Live Templates

  3. 单击右侧的加号图标,选择Live Template。

  4. 在弹出的对话框中,输入模板的缩写(Abbreviation)和描述(Description),例如sc2

  5. 在Template Text框中输入模板的文本,例如:

    // 创建SparkConf对象,并设置应用程序名称和运行模式
    val conf = new SparkConf()
    .setAppName("Starting...") // 设置应用程序名称
    .setMaster("local[*]") // 设置运行模式为本地模式

    // 创建SparkContext对象,并传入SparkConf对象
    val sc = new SparkContext(conf)

新建一个实例

2. 🥙Idea中配置文件模板自定义初始代码

在IntelliJ IDEA中配置每个新生成的文件的代码模板(File Templates)可以让您自定义每个新文件的初始代码。以下是配置步骤:

1)打开IntelliJ IDEA,转到Settings(Windows/Linux)。

2)在设置对话框中,选择Editor - File and Code Templates

3)在顶部选项卡中选择File Templates

4)在右侧窗格中,您可以看到当前可用的文件模板列表。选择Includes标签页下的File Header

5)在文本编辑器中,您可以看到文件头部注释的默认模板。在这里,您可以编辑或添加您想要的注释内容。在您的情况下,您可以粘贴您的注释模板,类似于以下内容:

复制代码
/**
 * @日期: 2024/1/31
 * @Author: Wang NaPao
 * @Blog: https://blog.csdn.net/weixin_40968325?spm=1018.2226.3001.5343
 * @Tips: 和我一起学习吧
 * @Description:
 */

3.🥙设置spark-submit提交程序时不在控制台打印日志信息

在用spark-submit提交程序时,会打印很多类似图片所示的日志信息,它们会把想要的结果给淹没,所以要想法子去除控制台的日志信息

解决办法: 在程序中设置日志级别

复制代码
Logger.getLogger("org.apache.spark").setLevel(Level.WARN)

关于setLevel()中的参数:

|--------------|-------------|-----------------------|
| LogLevel | Level | Use |
| OFF | 2147483647 | 关闭所有日志记录 |
| FATAL | 50000 | 如其翻译,致命的错误 |
| ERROR | 40000 | 错误信息提示,一般需要 Try Catch |
| WARN | 30000 | 潜在错误提示 |
| INFO | 20000 | 正常日志信息 |
| DEBUG | 10000 | 细粒度日志,用于应用调试 |
| TRACE | 5000 | 比调试更细粒度的日志信息 |
| ALL | -2147483648 | 打开所有日志记录 |

测试-

复制代码
package com.doit.com.doit.day0128

import org.apache.spark.{SparkConf, SparkContext}

import org.apache.log4j.{Level, Logger}
/**
 * @日期: 2024/1/29
 * @Author: Wang NaPao
 * @Blog: https://blog.csdn.net/weixin_40968325?spm=1018.2226.3001.5343
 * @Tips: 我是技术大牛
 * @Description:
 */


object Test05 {
  def main(args: Array[String]): Unit = {
    val conf = new SparkConf().setAppName("doe").setMaster("local[*]")
    val sc = new SparkContext(conf)
   Logger.getLogger("org.apache.spark").setLevel(Level.WARN)

    val rdd1 = sc.makeRDD(1 to 5, 2)
    val rdd2 = sc.makeRDD(Seq("A", "B", "C", "D", "E"), 2)
    val rdd3 = sc.makeRDD(Seq("A", "B", "C", "D", "E"), 3)

    println(rdd1.zip(rdd2).collect().toList)
    println(rdd2.zip(rdd1).collect().toList)
   

   // println(rdd1.zip(rdd3).collect().toList)


  }
}

相关推荐
大任视点3 小时前
新时代旅游职业教育系列教材编写研讨会成功举办
大数据
拓端研究室4 小时前
专题:2025AI时代的医疗保健业:应用与行业趋势研究报告|附130+份报告PDF、数据、可视化模板汇总下载
大数据·人工智能
小泊客6 小时前
使用讯飞星火 Spark X1-32K 打造本地知识助手
大数据·分布式·spark·大模型应用·本地知识助手
wangqiaowq7 小时前
StarRocks 3.5.7 安装部署
大数据
PPT百科7 小时前
PPT插入的音乐怎么让它播放到某一页就停?
大数据·职场和发展·powerpoint·职场·ppt模板
码上地球7 小时前
大数据成矿预测系列(八) | 从定性到概率:逻辑回归——地质统计学派的“集大成者”
大数据·逻辑回归
拓端研究室7 小时前
专题:2025中国医疗器械出海现状与趋势创新发展研究报告|附160+份报告PDF、数据、可视化模板汇总下载
大数据·人工智能·pdf
zskj_zhyl8 小时前
科技向暖,银发无忧:十五五规划中智慧养老的温度革命
大数据·人工智能·科技·物联网·生活
muxue1788 小时前
Hadoop集群搭建(上):centos 7为例(已将将安装所需压缩包统一放在了/opt/software目录下)
大数据·hadoop·centos
阿里云大数据AI技术9 小时前
【跨国数仓迁移最佳实践11】基于 MaxCompute Resource & Quota策略优化实现资源管理性能与成本最优平衡
大数据