Spark02 - SparkContext介绍

一、应用入口：SparkContext

Spark Application 程序入口为：SparkContext，任何一个应用首先需要构建 SparkContext 对象，如下两步构建：

第一步、创建 SparkConf 对象
- 设置 Spark Application 基本信息，比如应用的名称 AppName 和应用运行 Master
第二步、基于 SparkConf 对象，创建 SparkContext 对象

python 复制代码

# Import SparkConf class into program
from pyspark import SparkConf
# Import SparkContext and SparkSession classes
from pyspark import SparkContext # Spark
from pyspark.sql import SparkSession # Spark SQL

if __name__=="__main__":
    # local[*]: run Spark in local mode with as many working processors as logical cores on your machine
    # If we want Spark to run locally with 'k' worker threads, we can specify as "local[k]".
    master = "local[*]"
    # The `appName` field is a name to be shown on the Spark cluster UI page
    app_name = "RDD-basics"
    # Setup configuration parameters for Spark
    spark_conf = SparkConf().setMaster(master).setAppName(app_name)

    # Method 2: Getting or instantiating a SparkContext
    sc = SparkContext.getOrCreate(spark_conf)
    sc.setLogLevel('ERROR')

    data_list = [1, 2, 3, 3]
    rdd = sc.parallelize(data_list)
    print(rdd.collect())